Epson自主性AI雙臂機器人,
網站租用
,具「視覺辨識」、「力覺感覺」、「自主思考」特色,
網路行銷
,可勝任複雜性高組裝任務。 本報系資料庫 分享 facebook 機器學習已讓我們開始教導電腦如何看見,
主機代管
,用視覺探索世界。未來的世界中,
SEO優化
,家事機器人將能看著你的示範,
關鍵字達人
,學習如何清潔餐桌,打掃廁所,按照你的想法布置客廳和修剪花園中的盆栽;通勤時搭乘預約好的自駕車,輕鬆的從家中抵達公司;臉部和步伐辨識,加上非侵入式安全檢查,讓出國機場通關不用大排長龍,這些便利都基於電腦視覺技術,讓電腦能從影片或圖像獲得有用的資訊,從數位影像資料中進行推論。電腦視覺技術的快速發展,受益於機器學習的門檻愈來愈低,過去需要大量的計算能力和儲存空間,學習用的影像資料又不易取得,現在除軟硬體價格快速下降,能使用的資料集也愈來愈多,近年的電腦視覺技術已逐漸從監督式學習進化到無監督式學習,從需要標記巨量資料,到僅需少許無標記的資料即可完成訓練。世界智慧財產權組織(WIPO)在2019年人工智慧研究報告中,也發現電腦視覺是最常見的AI應用領域,有近一半的人工智慧相關專利,內容中提及電腦視覺。近兩年市調公司CB Insights發布的AI100新創公司所獲證美國專利,也有很多屬於圖形辨識、圖像分析和圖像增強等電腦視覺核心技術。同時根據Market Reports World市場調查報告,電腦視覺相關市場在五年內將成長到約500億美元。 電腦視覺主要應用領域包括健康醫療、安全監控、機器人和機器視覺、自駕車、消費者、運動和娛樂等,2019年以消費者應用的市場份額最高,超過150億美元,自駕車、機器人和機器視覺次之,約55億美元,其中消費者應用包含了解消費習性以強化個人化服務、消費者喜愛商品之類似產品的找尋等;機器視覺應用在製造業,例如產品的品質檢驗,機具的預防性維修和物流監控等,更還可利用X光或其他透視型影像技術,快速檢查橋墩結構或大樓安全,進行預防性維修或拆除。電腦視覺領域未來主要有幾項發展趨勢,(一)從圖形辨識到認知:深度學習讓圖形辨識的正確率大幅提升,開啟電腦視覺快速成長時代,從早期的辨識影像中是否含有貓或人,近年來該領域進一步發展圖像語義分割和實體切割技術,讓電腦對影像了解達到單一畫素的解析度,能分辨影像中有幾個人和幾隻貓,而全景分割能知道特定畫素屬於那個人和那隻貓,讓電腦視覺真正更接近人類視覺。(二) 雲端和邊緣運算競合:由於自行建立電腦視覺的模型相對困難,商用雲端運算成為許多企業執行電腦視覺計畫的選擇,包括Google、Microsoft、IBM、Amazon等都提供此類服務;邊緣運算能在終端即時直接進行資料處理,主要應用在網路品質不佳的地方,或是如自駕車等應用,邊緣運算也能夠讓使用者的體驗更加順暢,並透過僅傳送分析後有意義的資訊到雲端,減少網路和雲端負擔;兩者間的競合在近期因邊緣運算快速演進而漸趨白熱化。(三) 合成影像的精進與濫用:生成對抗網絡(GAN)是電腦視覺領域近年最具突破性的技術,能產生以假亂真的影像,此技術原本運用於增加訓練資料以加速機器學習,許多不正當的運用卻使這個技術可能對社會產生威脅,例如利用修改過的影片誤導民眾對特定事件看法,或利用GAN篡改超音波檢查的影像,讓醫師產生誤診。(四) 隱私權保護:自從人臉辨識和電腦視覺技術進入實用性階段,民眾就擔心個人隱私遭到破壞,或是政府濫用安全監控,舊金山就成為全美第一個立法禁止使用臉部辨識技術的城市。許多電腦視覺或人工智慧公司進行開發時,也開始更重視用戶或資料提供者的隱私保護。目前的電腦視覺技術已大幅躍進,能有效解決有限制、條件確定的問題,但需要洞察力的問題仍然十分困難,然而技術突破和電腦視覺的商業應用價值無庸置疑,科技快速演進也帶來新的問題,當影像合成愈來愈容易,愈來愈多的機器具備視覺功能,如何確認資訊的正確性和確保社會大眾隱私將成為重要課題。電腦視覺趨勢•從圖形辨識到認知•雲端和邊緣運算競合•合成影像的精進與濫用•隱私權保護(作者是國家實驗研究院科技政策研究與資訊中心研究員),