0
点赞
收藏
分享

微信扫一扫

《Reward is enough》 论文阅读


摘要

本文提出假说,Reward is enough for AGI

引言

举了松鼠找松子吃的例子,确实,最终吃了松子reward就为1,没吃到松子reward就为0

背景知识:强化学习

把世界和生活的所有事reward化:

《Reward is enough》 论文阅读_深度学习

讨论

尝试用强化学习解释世界的一切robot

结论

如果Reward-is-enough这个猜想是正确的,就能实现AGI。


举报

相关推荐

[论文阅读] 如何阅读论文

论文阅读——EarthPT

论文阅读——MoCo

论文阅读|DETR

kimera论文阅读

DGCN论文阅读

0 条评论