午夜无码人妻aⅴ大片色欲张津瑜,国产69久久久欧美黑人A片,色妺妺视频网,久久久久国产综合AV天堂

Google開源TensorFlow強化學習框架示例分析-創(chuàng)新互聯(lián)

Google開源TensorFlow強化學習框架示例分析,很多新手對此不是很清楚,為了幫助大家解決這個難題,下面小編將為大家詳細講解,有這方面需求的人可以來學習下,希望你能有所收獲。

十載的廣西網(wǎng)站建設經(jīng)驗,針對設計、前端、開發(fā)、售后、文案、推廣等六對一服務,響應快,48小時及時工作處理。全網(wǎng)營銷推廣的優(yōu)勢是能夠根據(jù)用戶設備顯示端的尺寸不同,自動調整廣西建站的顯示方式,使網(wǎng)站能夠適用不同顯示終端,在瀏覽器中調整網(wǎng)站的寬度,無論在任何一種瀏覽器上瀏覽網(wǎng)站,都能展現(xiàn)優(yōu)雅布局與設計,從而大程度地提升瀏覽體驗。創(chuàng)新互聯(lián)從事“廣西網(wǎng)站設計”,“廣西網(wǎng)站推廣”以來,每個客戶項目都認真落實執(zhí)行。

谷歌宣布開源基于 TensorFlow 的強化學習框架——Dopamine。

強化學習是一種人工智能(AI)技術,它使用獎勵(或懲罰)來驅動agent朝著特定目標前進,比如之前大火的Alpha Go擊敗人類頂尖圍棋選手,還有在 Dota2 對戰(zhàn)人類職業(yè)玩家的Open AI Five。同時,強化學習也是DeepMind 的深度Q 網(wǎng)絡(DQN)的核心部分,可以在多個workers 中分配學習,例如,在Atari 2600游戲中實現(xiàn)“超人”性能。麻煩的是,強化學習框架需要時間來掌握一個目標,往往是不靈活的,也不夠穩(wěn)定。

這就是谷歌提出替代方案的原因:基于TensorFlow的開源強化學習框架——Dopamine,從今天開始,它可以從Github獲得。

(https://github.com/google/dopamine/tree/master/docs#downloads)

谷歌研究人員表示,他們開源的這個 TensorFlow 強化學習框架強調三點:靈活、穩(wěn)定和可重復性。

受到主要組件之一大腦中獎勵動機行為行為的啟發(fā),以及反映神經(jīng)科學和強化學習的研究之間的聯(lián)系,這個平臺的目的是使推測性研究推動根本性的發(fā)現(xiàn),此版本還包括一組闡明如何使用整個框架的colabs。

易用性

為此,它包括了一套精心編寫的代碼(15個Python文件),專注于Arcade學習環(huán)境(一個用視頻游戲評估AI技術的平臺)以及四種不同的機器學習模型:上述提到的深度Q 網(wǎng)絡(DQN); C51; Rainbow agent的一個簡化版本; Implicit Quantile Network agent。清晰和簡潔是這個框架設計中的兩個關鍵考慮因素。

可重復性

為了實現(xiàn)強化學習的可重復性,代碼在Arcade學習環(huán)境支持的60個游戲中提供完整的測試覆蓋率和訓練數(shù)據(jù)(采用JSON和Python pickle格式),并遵循標準化結果以進行實證評估的最佳實踐。

基準測試

對于新的研究者來說,對自己的想法進行快速的基準測試是非常重要的。谷歌提供四個智能體的完整訓練數(shù)據(jù),包括ALE 支持的60 個游戲,格式為Python pickle 文件(對于使用谷歌框架訓練的智能體)和JSON 數(shù)據(jù)文件(用于對比其他框架訓練的智能體)。谷歌還提供了一個網(wǎng)站,研究者可以使用該網(wǎng)站對所有提供智能體在所有60 個游戲中的訓練運行進行快速可視化。

Google開源TensorFlow強化學習框架示例分析

谷歌的4 個智能體在Seaquest 上的訓練運行(Seaquest 是ALE 支持的Atari

除此之外,谷歌還推出了一個網(wǎng)站,允許開發(fā)人員將多個訓練中智能體的運行情況快速可視化。它還提供經(jīng)過訓練的模型、原始統(tǒng)計日志和TensorFlow event files,用于TensorBoard動態(tài)圖的繪制,TensorBoard是一個web應用可視化套件。

Google開源TensorFlow強化學習框架示例分析

“我們的希望是,我們的框架的靈活性和易用性將使研究人員能夠嘗試新的思想,無論是漸進的還是激進的?!?/p>

看完上述內容是否對您有幫助呢?如果還想對相關知識有進一步的了解或閱讀更多相關文章,請關注創(chuàng)新互聯(lián)-成都網(wǎng)站建設公司行業(yè)資訊頻道,感謝您對創(chuàng)新互聯(lián)的支持。

當前題目:Google開源TensorFlow強化學習框架示例分析-創(chuàng)新互聯(lián)
網(wǎng)頁路徑:http://www.ekvhdxd.cn/article5/dspjoi.html

成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供App開發(fā)、商城網(wǎng)站、服務器托管品牌網(wǎng)站設計、標簽優(yōu)化、網(wǎng)站收錄

廣告

聲明:本網(wǎng)站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經(jīng)允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)

網(wǎng)站建設網(wǎng)站維護公司