IT博客汇
  • 首页
  • 精华
  • 技术
  • 设计
  • 资讯
  • 扯淡
  • 权利声明
  • 登录 注册

    5. 马尔科夫决策过程

    starrow发表于 2022-10-13 09:52:32
    love 0
    强化学习要解决的问题,在数学上可以抽象为应用广泛的马尔科夫决策过程(Markov decision process)。马尔科夫决策过程研究如何在一个带有随机性的过程和离散的时间序列中做决策。


沪ICP备19023445号-2号
友情链接