什么是計算機視覺？可以應(yīng)用在哪些領(lǐng)域？

更新時間:2022年04月07日14時29分來源:傳智教育瀏覽次數(shù):

計算機視覺是什么

計算機視覺是指用攝像機和電腦及其他相關(guān)設(shè)備，對生物視覺的一種模擬。它的主要任務(wù)是讓計算機理解圖片或者視頻中的內(nèi)容，就像人類和許多其他生物每天所做的那樣。

我們可以將其任務(wù)目標(biāo)拆分為：

讓計算機理解圖片中的場景(辦公室，客廳，咖啡廳等)

讓計算機識別場景中包含的物體(寵物，交通工具，人等)

讓計算機定位物體在圖像中的位置(物體的大小，邊界等)

讓計算機理解物體之間的關(guān)系或行為(是在對話，比賽或吵架等)，以及圖像表達的意義(喜慶的，悲傷的等)

那我們在OpenCV階段，主要學(xué)習(xí)圖像處理，而圖像處理主要目的是對圖像的處理，比如平滑，縮放等，想、從而為其他任務(wù)(比如“計算機視覺”)做好前期工作。

根據(jù)對計算機視覺目標(biāo)任務(wù)的分解，可將其分為三大經(jīng)典任務(wù)：圖像分類、目標(biāo)檢測、圖像分割。

圖像分類、目標(biāo)檢測、圖像分割

圖像分類(Classification)：即是將圖像結(jié)構(gòu)化為某一類別的信息，用事先確定好的類別(category)來描述圖片。

目標(biāo)檢測(Detection)：分類任務(wù)關(guān)心整體，給出的是整張圖片的內(nèi)容描述，而檢測則關(guān)注特定的物體目標(biāo)，要求同時獲得這一目標(biāo)的類別信息和位置信息(classification + localization)。

圖像分割(Segmentation)：分割是對圖像的像素級描述，它賦予每個像素類別(實例)意義，適用于理解要求較高的場景，如無人駕駛中對道路和非道路的分割。

接下來的課程中我們將圍繞這三個任務(wù)對計算機視覺進行介紹。

應(yīng)用場景

計算機視覺涉及的領(lǐng)域復(fù)雜，具有廣泛的實際應(yīng)用范圍?？傮w而言，依賴于人工智能和機器學(xué)習(xí)，尤其是計算機視覺的創(chuàng)新的好處是，從電子商務(wù)行業(yè)到更經(jīng)典的各種類型和規(guī)模的公司都可以利用其強大的功能，下圖展示了相關(guān)的應(yīng)用場景及相關(guān)的企業(yè)：

計算機視覺的應(yīng)用場景

人臉識別

人臉識別技術(shù)目前已經(jīng)廣泛應(yīng)用于金融、司法、軍隊、公安、邊檢、政府、航天、電力、工廠、教育、醫(yī)療等行業(yè)。據(jù)業(yè)內(nèi)人士分析，我國的人臉識別產(chǎn)業(yè)的需求旺盛，需求推動導(dǎo)致企業(yè)敢于投入資金。

代表企業(yè)：Face++曠視科技、依圖科技、商湯科技、深醒科技、云從科技等。

人臉識別的主要應(yīng)用場景

視頻監(jiān)控

人工智能技術(shù)可以對結(jié)構(gòu)化的人、車、物等視頻內(nèi)容信息進行快速檢索、查詢。這項應(yīng)用使得讓公安系統(tǒng)在繁雜的監(jiān)控視頻中搜尋到罪犯的有了可能。在大量人群流動的交通樞紐，該技術(shù)也被廣泛用于人群分析、防控預(yù)警等。

代表企業(yè)：SenseTime 商湯科技、DeepGlint 格靈深瞳、依圖科技、云天勵飛、深網(wǎng)視界等。

人工智能在視頻監(jiān)控上的應(yīng)用

圖片識別分析

代表企業(yè)：Face++曠視科技、圖普科技、碼隆科技、酒咔嚓、YI+陌上花科技等。

圖片識別分析

輔助駕駛

隨著汽車的普及，汽車已經(jīng)成為人工智能技術(shù)非常大的應(yīng)用投放方向，但就目前來說，想要完全實現(xiàn)自動駕駛/無人駕駛，距離技術(shù)成熟還有一段路要走。不過利用人工智能技術(shù)，汽車的駕駛輔助的功能及應(yīng)用越來越多，這些應(yīng)用多半是基于計算機視覺和圖像處理技術(shù)來實現(xiàn)。

代表企業(yè)：縱目科技、TuSimple 圖森科技、馭勢科技、MINIEYE 佑駕創(chuàng)新、中天安馳等。