更新時間:2021年05月07日17時19分 來源:傳智教育 瀏覽次數(shù):
通訊、感知與行動是現(xiàn)代人工智能的三個關鍵能力,在這里我們將根據(jù)這些能力/應用對這三個技術領域進行介紹:
·計算機視覺(CV)
·自然語言處理(NLP)
·在 NLP 領域中,將覆蓋文本挖掘/分類、機器翻譯和語音識別。
·機器人
計算機視覺(CV)是指機器感知環(huán)境的能力。這一技術類別中的經(jīng)典任務有圖像形成、圖像處理、圖像提取和圖像的三維推理。物體檢測和人臉識別是其比較成功的研究領域。
當前階段:
計算機視覺現(xiàn)已有很多應用,這表明了這類技術的成就,也讓我們將其歸入到應用階段。隨著深度學習的發(fā)展,機器甚至能在特定的案例中實現(xiàn)超越人類的表現(xiàn)。但是,這項技術離社會影響階段還有一定距離,那要等到機器能在所有場景中都達到人類的同等水平才行(感知其環(huán)境的所有相關方面)。
發(fā)展歷史:
語音識別是指識別語音(說出的語言)并將其轉換成對應文本的技術。相反的任務(文本轉語音/TTS)也是這一領域內(nèi)一個類似的研究主題。
當前階段:
語音識別已經(jīng)處于應用階段很長時間了。最近幾年,隨著大數(shù)據(jù)和深度學習技術的發(fā)展,語音識別進展頗豐,現(xiàn)在已經(jīng)非常接近社會影響階段了。
語音識別領域仍然面臨著聲紋識別和「雞尾酒會效應」等一些特殊情況的難題。
現(xiàn)代語音識別系統(tǒng)嚴重依賴于云,在離線時可能就無法取得理想的工作效果。
發(fā)展歷史:
百度語音識別:
距離小于1米,中文字準率97%+
支持耳語、長語音、中英文混合及方言
這里的文本挖掘主要是指文本分類,該技術可用于理解、組織和分類結構化或非結構化文本文檔。其涵蓋的主要任務有句法分析、情緒分析和垃圾信息檢測。
當前階段:
我們將這項技術歸類到應用階段,因為現(xiàn)在有很多應用都已經(jīng)集成了基于文本挖掘的情緒分析或垃圾信息檢測技術。文本挖掘技術也在智能投顧的開發(fā)中有所應用,并且提升了用戶體驗。
文本挖掘和分類領域的一個瓶頸出現(xiàn)在歧義和有偏差的數(shù)據(jù)上。
發(fā)展歷史:
機器翻譯(MT)是利用機器的力量自動將一種自然語言(源語言)的文本翻譯成另一種語言(目標語言)。
當前階段:
機器翻譯是一個見證了大量發(fā)展歷程的應用領域。該領域最近由于神經(jīng)機器翻譯而取得了非常顯著的進展,但仍然沒有全面達到專業(yè)譯者的水平;但是,我們相信在大數(shù)據(jù)、云計算和深度學習技術的幫助下,機器翻譯很快就將進入社會影響階段。
在某些情況下,俚語和行話等內(nèi)容的翻譯會比較困難(受限詞表問題)。
專業(yè)領域的機器翻譯(比如醫(yī)療領域)表現(xiàn)通常不好。
發(fā)展歷史:
機器人學(Robotics)研究的是機器人的設計、制造、運作和應用,以及控制它們的計算機系統(tǒng)、傳感反饋和信息處理。
機器人可以分成兩大類:固定機器人和移動機器人。固定機器人通常被用于工業(yè)生產(chǎn)(比如用于裝配線)。常見的移動機器人應用有貨運機器人、空中機器人和自動載具。機器人需要不同部件和系統(tǒng)的協(xié)作才能實現(xiàn)最優(yōu)的作業(yè)。其中在硬件上包含傳感器、反應器和控制器;另外還有能夠實現(xiàn)感知能力的軟件,比如定位、地圖測繪和目標識別。
當前階段:
自上世紀「Robot」一詞誕生以來,人們已經(jīng)為工業(yè)制造業(yè)設計了很多機器人。工業(yè)機器人是增長最快的應用領域,它們在 20 世紀 80 年代將這一領域帶入了應用階段。在安川電機、Fanuc、ABB、庫卡等公司的努力下,我們認為進入 21 世紀之后,機器人領域就已經(jīng)進入了社會影響階段,此時各種工業(yè)機器人已經(jīng)主宰了裝配生產(chǎn)線。此外,軟體機器人在很多領域也有廣泛的應用,比如在醫(yī)療行業(yè)協(xié)助手術或在金融行業(yè)自動執(zhí)行承銷過程。
但是,法律法規(guī)和「機器人威脅論」可能會妨礙機器人領域的發(fā)展。還有設計和制造機器人需要相對較高的投資。
發(fā)展歷史:
總的來說,人工智能領域的研究前沿正逐漸從搜索、知識和推理領域轉向機器學習、深度學習、計算機視覺和機器人領域。
大多數(shù)早期技術至少已經(jīng)處于應用階段了,而且其中一些已經(jīng)顯現(xiàn)出了社會影響力。一些新開發(fā)的技術可能仍處于工程甚至研究階段,但是我們可以看到不同階段之間轉移的速度變得越來越快。
猜你喜歡: