- 2016年5月17日
- 已讀 3 分鐘

圖像辨識成未來趨勢

去年5月，微軟所推出的「How-Old.net」活動，讓Facebook上瘋狂流傳了一堆標示年齡的照片；那其實是微軟透過它自家的圖像辨識技Project Oxford對用戶的照片進行偵測，接著再依據特定的演算法分辨出用戶的性別以及推算他們的年齡。除了微軟的Project Oxford，Google最近也公開推出了另一套圖像辨識Cloud Vision的API服務，提供更多第三方人員使用這套Google的圖像辨識技術。

甚麼是API？

API 的全名是 Application Programming Interface（應用程式介面），主要是一些系統開發公司為了幫助第三方人員將系統套入自家產品所推出的系統溝通操作介面，第三方人員透過API的幫助可以更快速強化自家產品的功能。

舉例來說，Apple在2014年推出的IOS 8 套件，裡面包含了4000多種的API，這些API可以幫助全世界IOS的開發工程師擴充他們的應用程式（App）或是提升自家產品的功能性。再舉一個更具體的例子，Google Map這套應用程式相信大家都不陌生，這是由Google開發的一套提供大眾查詢與規劃路線的應用程式。第三方人員可以透過使用Google Map API，將Google龐大的地圖資料與自家研發的產品進行連結，進而增強自家產品的功能。

Cloud Vision可以「看」的更清楚

Google其實在2015年11月就推出了圖像辨識Cloud Vision的 API，只不過之前Google都採取封閉測試的方式，因此一般公司或企業都無法任意使用這項服務。不過Google在2月18日的時候正式宣佈公開測試Cloud Vision API，讓所有第三方人員都可以輕鬆地就將這套圖像辨識技術運用在應用程式當中。

Cloud Vision這個圖像辨識技術除了可以辨識基本的文字之外，現在還可以辨認出圖像中的物件。Google也表示Cloud Vision背後的演算法可以幫助開發人員辨識上千種不一樣的物品，像是食物、建築物、動物等等。此外，Cloud Vision還多了一個分類的新功能，它可以幫助開發人員分辨出限制級的照片內容，然後進行封鎖。這個分類功能更厲害的地方在於它還可以偵測人類的臉部特征，像是我們微笑的臉，還是傷心的表情都可以透過Cloud Vision辨識出來。

Google和微軟的圖像識別技術

看完了Cloud Vision功能之後，這裡也整理了微軟Project Oxford所提供的相關功能，包含檢查拼字、追蹤人臉部以及消除拍攝影片時的震動、辨識說話人的身份、外表年齡估計以及性別辨識。

從功能性來看，也許Google Cloud Vision會比微軟Project Oxford強大一點，主要在於它可以辨識人的臉部表情。但從精確度來看，雖然目前這兩個官網上都找不到精確的數字，但是有部分的開發人員在網路上測試之後認為Project Oxford在精確性上會比Google Cloud Vision好，主要是因為微軟在圖像辨識技術上的研發時間較長。

對第三方人員來說，除了功能性和精確性的比較之外，他們更在乎價格上的差異。Cloud Vision和Project Oxford的API在價格策略上都是採取功能獨立計費方式，像是文字辨識、人臉辨識等等依據不一樣的功能去估算價格。因此對於第三方人員來說，最佳的選擇方式應該是評估自家產品的特性之後，再去比較Cloud Vision以及Project Oxford之間在功能性、精確性以及價格上的差異。由於這兩家公司的API都有提供免費試用的額度，像是Cloud Vision提供1000張免費圖片辨識，而Project Oxford則提供5000張試用，所以開發者可以在購買之前先去試用這兩家企業的API然後再進行購買抉擇。

看完目前圖像辨識技術可以做的事情之後，相信未來圖像辨識這項技術將會越來越普遍地運用在我們日常生活中

圖像辨識成未來趨勢

New Articles