首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台
行动起来,活在当下
累计撰写
5205
篇文章
累计创建
1860
个标签
累计收到
0
条评论
栏目
首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
目 录
CONTENT
以下是
迁移学习
相关的文章
2026-02-01
无需TD学习的强化学习:基于分而治之的替代范式
本文介绍了一种基于“分而治之”范式的强化学习(RL)算法,它不依赖于传统的时间差分(TD)学习。该算法能有效扩展到长期任务,解决了TD学习在可扩展性方面的挑战。研究人员提出了“迁移学习(TRL)”,通过限制子目标搜索空间和使用期望回归来实现了可扩展的、分而治之的价值学习。
2026-02-01
0
0
0
AI基础/开发
AI工具应用
2026-01-13
表格机器学习任务中使用的10种嵌入(Embeddings)方法
2026-01-13
0
0
0
AI基础/开发
AI工具应用
2026-01-07
无需TD学习的强化学习:基于分而治之的新范式
本文介绍了一种基于“分而治之”范式的强化学习(RL)算法,它不依赖于存在扩展性挑战的时序差分(TD)学习。该方法在处理长程任务时表现出色,通过对轨迹进行对半分割并结合其值来更新整体轨迹的值,理论上可将贝尔曼递归次数降至对数级别。研究者提出了“迁移学习(TRL)”,并成功将其应用于复杂的、基于目标的RL任务,取得了优于多种基线方法的性能。
2026-01-07
0
0
0
AI基础/开发
AI工具应用