IT博客汇
首页
精华
技术
设计
资讯
扯淡
权利声明
登录
注册
5. 马尔科夫决策过程
starrow
发表于
2022-10-13 09:52:32
love
0
强化学习要解决的问题,在数学上可以抽象为应用广泛的马尔科夫决策过程(Markov decision process)。马尔科夫决策过程研究如何在一个带有随机性的过程和离散的时间序列中做决策。