热搜: 剑 历史 公务员 寒假 民族关系 公众参与 地方各级 宪法
手机扫码访问
Q 函数 Q(s,a)是指在一个给定状态 s下,采取某一个动作 a 之后,后续的各个状态 所能得到的回报的 ()。Cls阿拉题库(alatiku.com)|我的题库|免费题库
A、期望值Cls阿拉题库(alatiku.com)|我的题库|免费题库
B、最大值Cls阿拉题库(alatiku.com)|我的题库|免费题库
C、最小值Cls阿拉题库(alatiku.com)|我的题库|免费题库
D、总和Cls阿拉题库(alatiku.com)|我的题库|免费题库