精选
分类
电台
社区
我的
主播入驻
APP下载
HOT
联系我们
登录
首页
>
科技
>
AI可可AI生活
>
「走近强化学习」第一集:什么是强化学习?
节目
「走近强化学习」第一集:什么是强化学习?
所属专辑:
AI可可AI生活
主播:
爱可可爱生活
最近更新:
3小时前
时长:
07:27
播放
分享
下载
扫码下载蜻蜓app
听书/听小说/听故事
4.5亿用户的选择
节目简介
本期「走近强化学习」通过宠物狗训练的生动案例,深入浅出地为听众解释了强化学习的核心原理,让听众能轻松理解“探索-试错-反馈-优化”的学习流程,以及强化学习在人工智能领域的实际应用。
评论
还没有评论哦
该专辑其他节目
AI前沿:AI前沿:纯RL驱动,知识蒸馏与智能论文搜索
AI前沿:思维进化、意图迷雾与算力突围
AI前沿:从否定理解到脑状态预测的最新突破
AI前沿:从优化训练到多模态推理
AI前沿:蛋白质优化、机器深度写作与扩散模型
AI前沿:从偏微分方程到AI-RAN
AI前沿:从大模型打扑克到幻觉的秘密
AI前沿:从奖励优化到硬件加速
AI前沿:多智能体、因果对齐与持续学习
AI前沿:深度思考、代码修复与文化偏见
AI前沿:从时滞方程到模型泛化、AI研究助理
AI前沿:扩散模型、推理模型与GAN的革新
AI前沿:推理、公平与学习的交响曲
AI前沿:LLM如何提问?机器人如何“抄近路”?
AI前沿:从指令剪枝到大脑记忆、生成增强检索
AI前沿:上下文重塑、推理强化与效率飞跃
AI前沿:从SGD稳定边缘到全景3D重建
AI前沿:从下注到过度思考
AI前沿:测试时记忆、高效推理、鲁棒训练、算术增强
AI前沿:数据、对齐、信任、解释与效率
AI前沿:无状态优化、TeLU激活和智能体生态
AI前沿:从贝叶斯优化到大模型推理
AI前沿:新型训练方法、模型优化与记忆增强
「走近强化学习」第二集:探索与利用
AI前沿:从分子设计到神经解码
AI前沿:采样新思路,训练新方法
AI前沿:AI的“自我认知”与“遗忘”难题
「走近强化学习」第一集:什么是强化学习?
AI前沿:AI“作弊”、模拟科研与评测陷阱
AI前沿:从“幻觉”纠正到检索加速
回到顶部
/
2.0
1.75
1.25
1.0
0.8
0.5
收听历史
清空列表