教育行業(yè)A股IPO第一股(股票代碼 003032)

全國咨詢/投訴熱線:400-618-4000

為什么傳統(tǒng)的測試方法不能保證AI軟件的質量?

更新時間:2019年12月11日14時42分 來源:傳智播客 瀏覽次數(shù):

近兩年人工智能發(fā)展迅猛,各種應用層出不窮,但其質量卻是良莠不齊。原因在于大部分測試童鞋還在用傳統(tǒng)的測試方式也就是通過界面和功能對人工智能軟件進行測試,但是AI軟件從開發(fā)到測試都很不同于傳統(tǒng)軟件,本文就以智能文本分類系統(tǒng)為例通過兩步來介紹為何傳統(tǒng)的測試方法不能保證AI軟件的質量。

一、工智能軟件測試的痛點

目標

掌握人工智能軟件測試面臨的現(xiàn)實痛點

步驟

1.智能文本分類系統(tǒng)是AI自然語言處理的一個基本應用,界面如下圖所示

1576046122215_人工智能測試.jpg

2.對其測試時需要根據(jù)不同的輸入點擊獲取標簽得出所屬的類別以及所屬類別的概率值

3.通過功能和界面進行測試的話需要輸入各種可能輸入的文本,耗時巨大,并且也不太現(xiàn)實

4.從界面上對得到的score代表的概率值進行判斷無法得出一個客觀的評判,這個值多少合適判斷不了

5.因此傳統(tǒng)界面和功能測試完了判斷不了智能文本分類系統(tǒng)能否上線

二、AI軟件測試的正確方式

目標

掌握AI軟件測試的正確方式

步驟

1.了解AI軟件測試的本質

人工智能軟件是根據(jù)算法對大量的數(shù)據(jù)進行訓練找規(guī)律,最終得出一個模型來對新的數(shù)據(jù)進行預測,預測的時候會給出一個概率值。

2.AI軟件測試的正確方式

通過實現(xiàn)人工智能算法自帶的評測指標來進行AI軟件的測試可以很好的評估軟件的質量,完美解決窮舉各種輸入和概率值大小的現(xiàn)實問題

3.通過AI模型測試的具體評測指標

以智能文本分類為例,其采用了監(jiān)督示機器學習的分類算法,對應的評測指標有:

準確率、精確率、召回率

總結

本文通過智能文本分類系統(tǒng)面臨的測試難點來指出AI軟件測試過程中的通用難題。以此指出了通過功能和界面測試人工智能軟件不能保證AI軟件的質量,正確的方式應該是通過實現(xiàn)AI軟件算法自帶的評測進行進行測試。

0 分享到:
和我們在線交談!