W3Cschool
恭喜您成為首批注冊用戶
獲得88經(jīng)驗(yàn)值獎(jiǎng)勵(lì)
在本章中,您將詳細(xì)學(xué)習(xí)使用 Python 進(jìn)行 AI 強(qiáng)化學(xué)習(xí)的概念。
這種類型的學(xué)習(xí)被用來加強(qiáng)或加強(qiáng)基于評論者信息的網(wǎng)絡(luò)。 也就是說,在強(qiáng)化學(xué)習(xí)下訓(xùn)練的網(wǎng)絡(luò)從環(huán)境中獲得一些反饋。 但是,反饋是評價(jià)性的,并且不像監(jiān)督式學(xué)習(xí)的情況那樣具有啟發(fā)性。 基于這種反饋,網(wǎng)絡(luò)將對權(quán)重進(jìn)行調(diào)整以獲得更好的評論信息。
這個(gè)學(xué)習(xí)過程類似于監(jiān)督學(xué)習(xí),但我們可能擁有的信息非常少。 下圖給出了強(qiáng)化學(xué)習(xí)的框圖 -
Copyright©2021 w3cschool編程獅|閩ICP備15016281號-3|閩公網(wǎng)安備35020302033924號
違法和不良信息舉報(bào)電話:173-0602-2364|舉報(bào)郵箱:jubao@eeedong.com
掃描二維碼
下載編程獅App
編程獅公眾號
聯(lián)系方式:
更多建議: