蘑菇书,强化学习

蘑菇书,强化学习

科技散人
804527
强化学习概述,马尔科夫决策过程,表格型方法,深度q网络,针对连续动作的深度q网络,稀疏奖励,模仿学习,深度确定性策略梯度
用户评论

    还没有评论,快来发表第一个评论!