中科大doh
-
发布了文章 2个月前
中科大提出动作价值表征学习新方法,率先填补长期决策信息的缺失
中科大提出动作价值表征学习新方法,率先填补长期决策信息的缺失 在视觉强化学习中,许多方法未考虑序列决策过程,导致所学表征缺乏关键的长期信息的空缺被填补上了。来自中科大的研究人员在信息瓶颈(Information Bot...
-
发布了文章 2个月前
SocraticLM – 中科大和科大讯飞共同推出的苏格拉底教学大模型
SocraticLM 是通过苏格拉底式的教学法来教授数学的创新人工智能模型,模型由中科大和科大讯飞共同开发,采用了“Thought-Provoking”教学范式,通过提问引导学生主动思考和解决问题。SocraticLM 在名...
-
发布了文章 2个月前
QA-baidu09MDT – 中科大联合科大讯飞推出开源音乐生成模型
QA-MDT(Quality-aware Masked Diffusion Transformer)是由中国科学技术大学和科大讯飞联合推出的开源音乐生成模型。模型基于文本描述生成高质量且音乐性强的音乐,创新的质量感知训练策略...
没有更多内容










