游客
登录
我的空间
使用说明下载
分类:
全部
江开本科
江开专科
江苏开放大学
江苏城市职业学院
江苏老年开放大学
国家开放大学
老年学历教育
素质教育
社会教育
江苏科协
名师课堂
政策法规
知识体系
综合
江苏学习在线
开放大学栏目
人群:
幼儿
中老年
妇女
大众
青少年
知识体系:
信息技术
经济学
法学
教育学
文学
历史学
工学
医学
管理学
艺术学
军事学
哲学
农学
更多筛选
课程
资源
全部
视频
音频
图片
文档
PPT
其它
最新
最热
最赞
3.3 状态价值的定义与思想
leixy
1432
3.2 三连棋游戏第一步走角落
leixy
1432
3.1 三连棋游戏第一步走中间
leixy
1433
2.5 epsilon贪心策略
leixy
1427
2.4 探索与利用的意义
leixy
1428
2.3 探索利用平衡
leixy
1426
2.2 简单策略和贪婪策略
leixy
1423
1.5强化学习的应用
leixy
1428
1.4环境的确定性与随机性
leixy
1428
1.3环境已知与未知
leixy
1436
1.1马尔可夫过程
leixy
1426
第四单元 QLearning
leixy
1627
第七单元 Actor-Critic-new
leixy
1620
Off-policy Actor-Critic(V1)
leixy
1711
Deterministic Policy Gradient (V1)
leixy
1701
强化学习-课程教学设计一体化实施方案 (7.4)
leixy
2258
强化学习-课程教学大纲 (7.4)
leixy
2262
强化学习-课程考核大纲 (7.4)
leixy
2356
第二章_04_探索与利用的意义new
leixy
2331
第三章_02_三连棋游戏第一步走角落new
leixy
2435
首页
<
1
2
3
4
5
6
>
尾页