聯合隨機性策略的深度強化學習探索方法
所屬分類:技術論文
上傳者:zhoubin333
文檔大?。?span>679 K
標簽: 強化學習 深度強化學習 探索利用困境
所需積分:0分積分不夠怎么辦?
文檔介紹: 目前深度強化學習算法已經可以解決許多復雜的任務,然而如何平衡探索和利用的關系仍然是強化學習領域的一個基本的難題,為此提出一種聯合隨機性策略的深度強化學習探索方法。該方法利用隨機性策略具有探索能力的特點,用隨機性策略生成的經驗樣本訓練確定性策略,鼓勵確定性策略在保持自身優勢的前提下學會探索。通過結合確定性策略算法DDPG和提出的探索方法,得到基于隨機性策略指導的確定性策略梯度算法(SGDPG)。在多個復雜環境下的實驗表明,面對探索問題,SGDPG的探索效率和樣本利用率要優于DDPG算法。
現在下載
VIP會員,AET專家下載不扣分;重復下載不扣分,本人上傳資源不扣分。
主站蜘蛛池模板: 4k岛国精品午夜高清在线观看 | 日本精品中文字幕在线播放 | 在线久草视频 | 免费在线精品视频 | 欧美日韩高清在线观看 | 欧美在线看片a免费观看 | 欧美又粗又硬又大久久久 | 欧美性猛交xxxxx免费看 | 2015小明看日韩成人免费视频 | 一个人在线观看的免费视频www | 天天操天天干天天摸 | 密私密影院在线观看 | 色播99 | 欧美经典成人在观看线视频 | 天天久久| 色五夜| 亚洲成年网站 | 久久综合狠狠综合久久综合88 | 国产成人精品免费视频大全软件 | 欧美性猛交ⅹxxx乱大交禽 | 成人看片黄在线观看 | 午夜免费视频观看在线播放 | 亚洲国产一区二区a毛片 | 国产精品成人在线 | 美腿丝袜中文字幕 | 欧美一级日韩一级亚洲一级va | 丁香综合五月 | 黄色三级视频在线 | 亚洲天天看 | 色噜噜狠狠狠狠色综合久一 | 好黄好猛好爽好痛的视频 | 免费成人一级片 | 亚洲国产一区在线 | 欧美国产激情二区三区 | 免费视频精品一区二区三区 | 青青青国产色视频在线观看 | 精品国产国语对白主播野战 | 视频区小说区图片区激情 | 免费看黄色三级毛片 | 涩涩涩导航| 波多野结衣啪啪 |