教育行業(yè)A股IPO第一股(股票代碼 003032)

全國咨詢/投訴熱線:400-618-4000

提高人工智能模型準(zhǔn)確率的測試過程中需要注意什么?

更新時間:2019年12月20日16時11分 來源:傳智播客 瀏覽次數(shù):

現(xiàn)在人工智能行業(yè)發(fā)展迅猛,那么人工智能產(chǎn)品特別是使用分類算法實現(xiàn)的產(chǎn)品中判斷其能否上線通常是通過算法自帶的準(zhǔn)確率指標(biāo)進(jìn)行對比進(jìn)行的。而準(zhǔn)確率是人工智能模型通過訓(xùn)練后得出的,因此我們需要提高訓(xùn)練的準(zhǔn)確率,這其中增加訓(xùn)練次數(shù)就是一個通用的方法,但是需要注意的是并不是訓(xùn)練次數(shù)越多越好。本文就通過3步來講述怎樣保證合適的訓(xùn)練次數(shù)來確保模型的準(zhǔn)確率。

第一步:了解模型訓(xùn)練和結(jié)果的關(guān)系

目標(biāo)

掌握人工智能產(chǎn)品評測指標(biāo)跟訓(xùn)練過程的關(guān)系

步驟

1.人工智能產(chǎn)品的本質(zhì)是選擇合適算法然后根據(jù)歷史數(shù)據(jù)進(jìn)行訓(xùn)練得出一個最終的模型,通過這個模型即可對新數(shù)據(jù)進(jìn)行預(yù)測,而預(yù)測的好壞取決于訓(xùn)練時得到的這個模型的指標(biāo),比如說分類算法的準(zhǔn)確率

2.分類算法的準(zhǔn)確率在訓(xùn)練結(jié)束的時候就已經(jīng)固定了,因此需要在訓(xùn)練過程中進(jìn)行一些改善的操作以期最終提升模型的準(zhǔn)確率

3.通過增加訓(xùn)練次數(shù)可以在訓(xùn)練過程中讓算法更好的從歷史數(shù)據(jù)中歸納、統(tǒng)計規(guī)律進(jìn)而提升模型的準(zhǔn)確率。

第二步:過擬合的定義

目標(biāo)

掌握過擬合的定義

步驟

1.模型準(zhǔn)確率的判斷

• 我們的數(shù)據(jù)分為訓(xùn)練數(shù)據(jù)和驗證數(shù)據(jù),通過訓(xùn)練數(shù)據(jù)進(jìn)行訓(xùn)練可以得到一個模型,而模型必須在驗證數(shù)據(jù)上進(jìn)行評測才能科學(xué)評判其準(zhǔn)確率,在訓(xùn)練數(shù)據(jù)上的準(zhǔn)確率沒有參考價值

• 在訓(xùn)練數(shù)據(jù)上隨著訓(xùn)練次數(shù)的增加,訓(xùn)練集上的準(zhǔn)確率會增加,但是增加到一定程度的話就必須停止訓(xùn)練了,因為算法已經(jīng)將數(shù)據(jù)中的規(guī)律全部學(xué)習(xí)完畢,再進(jìn)行訓(xùn)練算法會學(xué)習(xí)到一些不屬于規(guī)律的噪音數(shù)據(jù)。這時候我們就稱之為訓(xùn)練過程中出現(xiàn)了過擬合。

2.過擬合的定義

• 過擬合就是模型的準(zhǔn)確率在訓(xùn)練集上很高,但是在驗證集上比較差,這時候訓(xùn)練得出的模型是不能上線的。

第三步:通過圖形判斷過擬合來確保模型準(zhǔn)確率

目標(biāo)

• 掌握圖形判斷過擬合的方法

• 掌握確保準(zhǔn)確率的方法

步驟

1.通過準(zhǔn)確率判斷過擬合,如下圖所示:

人工智能模型準(zhǔn)確率模型01

• 如果圖形中在驗證集上的準(zhǔn)確率先上升后下降而訓(xùn)練集的準(zhǔn)確率一直上升的話在驗證集準(zhǔn)確率下降的一刻就表示出現(xiàn)了過擬合

2.通過損失率判斷過擬合,如下圖所示:

人工智能模型準(zhǔn)確率02


• 如果圖形中在驗證集上的損失率先下降后上升而訓(xùn)練集的準(zhǔn)確率一直下降的話在驗證集準(zhǔn)確率上升的一刻就表示出現(xiàn)了過擬合。

3.在出現(xiàn)過擬合的一刻結(jié)束模型的訓(xùn)練,可保證模型的準(zhǔn)確率達(dá)到最佳

總結(jié)

測試人員在測試人工智能產(chǎn)品的時候,需要對模型的準(zhǔn)確率做個提升的測試,而通過增加訓(xùn)練次數(shù)可以很好達(dá)到這個效果,需要注意的是訓(xùn)練次數(shù)有個度,而通過圖形檢測在出現(xiàn)過擬合的同時結(jié)束模型訓(xùn)練可以確保模型的質(zhì)量最佳。推薦了解傳智播客人軟件測試培訓(xùn)課程。


猜你喜歡:
如何模擬弱網(wǎng)測試?

0 分享到:
和我們在線交談!