更新時間:2018年02月08日10時57分 來源:傳智播客 瀏覽次數(shù):
Python 6節(jié)課機器學習入門 | ||
我們可以使用很多方法收集樣本護具,如:制作網(wǎng)絡爬蟲從網(wǎng)站上抽取數(shù)據(jù)、從RSS反饋或者API中得到信息、設備發(fā)送過來的實測數(shù)據(jù)。 | ||
開發(fā)機器學習應用程序的步驟
(1)收集數(shù)據(jù)
我們可以使用很多方法收集樣本護具,如:制作網(wǎng)絡爬蟲從網(wǎng)站上抽取數(shù)據(jù)、從RSS反饋或者API中得到信息、設備發(fā)送過來的實測數(shù)據(jù)。
(2)準備輸入數(shù)據(jù)
得到數(shù)據(jù)之后,還必須確保數(shù)據(jù)格式符合要求。
(3)分析輸入數(shù)據(jù)
這一步的主要作用是確保數(shù)據(jù)集中沒有垃圾數(shù)據(jù)。如果是使用信任的數(shù)據(jù)來源,那么可以直接跳過這個步驟
(4)訓練算法
機器學習算法從這一步才真正開始學習。如果使用無監(jiān)督學習算法,由于不存在目標變量值,故而也不需要訓練算法,所有與算法相關(guān)的內(nèi)容在第(5)步
(5)測試算法
這一步將實際使用第(4)步機器學習得到的知識信息。當然在這也需要評估結(jié)果的準確率,然后根據(jù)需要重新訓練你的算法
(6)使用算法
轉(zhuǎn)化為應用程序,執(zhí)行實際任務。以檢驗上述步驟是否可以在實際環(huán)境中正常工作。如果碰到新的數(shù)據(jù)問題,同樣需要重復執(zhí)行上述的步驟