閱讀(3.2k) 書簽贊(0) 我要糾錯(cuò)

AI人工智能強(qiáng)化學(xué)習(xí)基礎(chǔ)

2020-09-24 11:03 更新

在本章中，您將詳細(xì)學(xué)習(xí)使用 Python 進(jìn)行 AI 強(qiáng)化學(xué)習(xí)的概念。

強(qiáng)化學(xué)習(xí)基礎(chǔ)

這種類型的學(xué)習(xí)被用來加強(qiáng)或加強(qiáng)基于評論者信息的網(wǎng)絡(luò)。也就是說，在強(qiáng)化學(xué)習(xí)下訓(xùn)練的網(wǎng)絡(luò)從環(huán)境中獲得一些反饋。但是，反饋是評價(jià)性的，并且不像監(jiān)督式學(xué)習(xí)的情況那樣具有啟發(fā)性。基于這種反饋，網(wǎng)絡(luò)將對權(quán)重進(jìn)行調(diào)整以獲得更好的評論信息。

這個(gè)學(xué)習(xí)過程類似于監(jiān)督學(xué)習(xí)，但我們可能擁有的信息非常少。下圖給出了強(qiáng)化學(xué)習(xí)的框圖 -