近年來,隨著硬件的發(fā)展、市場需求和計算機視覺技術的普及,主要有以下趨勢:
拓展領域(不只是工業(yè),還有民用):自動檢測取代人工檢測是必然的發(fā)展趨勢。需求越來越多樣化。原來只是生產(chǎn)線。現(xiàn)在,制造、醫(yī)療、電子、倉儲等各個領域都有各種各樣的應用。比如國內(nèi)某知名電商公司使用3D檢測包裹尺寸,內(nèi)部跟蹤與總參數(shù)相匹配。
2D到3D:行業(yè)基本都是3D部件,二維成像畢竟是三維空間實際情況下的病態(tài)數(shù)據(jù)采集。因此,3D周圍的各種檢測、測量、機器人引導等項目層出不窮,類似于計算機視覺的情況,什么結(jié)構(gòu)光,ToF、雙目等技術各公司也多如牛毛。
系統(tǒng)的實施受到各種因素的極大限制:如果你問我做一個工業(yè)視覺檢測項目重要的是什么,我肯定會說我可以得到一張高質(zhì)量的圖片,但是為了得到這樣的圖片,我們需要考慮太多,比如光源、鏡頭選擇、傳感器選擇、節(jié)拍考慮、安裝布局、自動化集成、環(huán)境因素考慮、工件狀態(tài)變化等。如果有任何問題,都會影響你的圖像質(zhì)量。如果你沒有足夠好的圖片,那么無論算法有多強大,而且因為生產(chǎn)線有良好的產(chǎn)品率和節(jié)拍要求,整個工業(yè)視覺檢測系統(tǒng)都不夠快。
算法沒有硬件發(fā)展快:這是我的感覺,我覺得這是目前很大的瓶頸。從系統(tǒng)的角度來看,硬件正在向可移動的嵌入式方向發(fā)展,但目前軟件的智能遠遠不夠。目前,在計算機視覺領域,深度學習神經(jīng)網(wǎng)絡在機器視覺領域的成功應用很少,ViDi就是其中之一。Fanuc/PreferredNetworks和Google的機器人抓取是一種比較簡單的方法,當目標對象多變,特征復雜,樣本數(shù)量不足時,你想用深度學習根本沒有機會,或者回到傳統(tǒng)的老路上,再考慮實時嚴格的要求,機器視覺特別需要一種新的智能方法,廣泛應用于大多數(shù)應用領域,要么創(chuàng)新,要么改進,要么全面。
具體問題要具體看:機器視覺與具體應用領域密切相關。每個應用程序都需要選擇與之匹配的特殊硬件和軟件,都需要特殊的設計,所以沒有一個解決方案可以適用于所有情況。
公司:國內(nèi)做集成代理的人很多,真正有領先技術的人太少了。看看凌云和大恒,你就會知道發(fā)生了什么。最近有視頻監(jiān)控的大海康威視,也做機器視覺。在國外,你可以研究一下Cognex和Keyence。還有,沒有一家公司會做一個機器視覺系統(tǒng)的所有東西,核心是算法和整個硬件的整合。有專門的公司做鏡頭,有專門的公司做光源,有專門的公司做支架,沒有一家公司會自己做。
最終,我想談談工業(yè)視覺檢測以及計算機視覺,雖然它們都處理圖像數(shù)據(jù),但它們之間有很大的不同。一個是整個系統(tǒng)級別的應用導向,一個是半理論半應用的結(jié)合,專注于算法。但也不是沒有聯(lián)系。比如AR在工業(yè)制造中的應用,你分不清是哪種技術。