AI人工智能 強(qiáng)化學(xué)習(xí)基礎(chǔ)

2020-09-24 11:03 更新

在本章中,您將詳細(xì)學(xué)習(xí)使用 Python 進(jìn)行 AI 強(qiáng)化學(xué)習(xí)的概念。

強(qiáng)化學(xué)習(xí)基礎(chǔ)

這種類型的學(xué)習(xí)被用來加強(qiáng)或加強(qiáng)基于評論者信息的網(wǎng)絡(luò)。 也就是說,在強(qiáng)化學(xué)習(xí)下訓(xùn)練的網(wǎng)絡(luò)從環(huán)境中獲得一些反饋。 但是,反饋是評價(jià)性的,并且不像監(jiān)督式學(xué)習(xí)的情況那樣具有啟發(fā)性。 基于這種反饋,網(wǎng)絡(luò)將對權(quán)重進(jìn)行調(diào)整以獲得更好的評論信息。

這個(gè)學(xué)習(xí)過程類似于監(jiān)督學(xué)習(xí),但我們可能擁有的信息非常少。 下圖給出了強(qiáng)化學(xué)習(xí)的框圖 -

img

以上內(nèi)容是否對您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號
微信公眾號

編程獅公眾號