突破!自然语言强化学习(NLRL):一个可处理语言反馈的强化学习框架

将强化学习的核心概念类比为基于自然语言的形式,开辟了一条通向更智能、更自然的AI决策学习的新道路。
阅读原文

二十年孤独探索,今朝百家争鸣:赵明国与人形机器人之路

“二十年过去,仍在坚持的仅有我一人。​”
阅读原文

2024全球智博会即将启幕,完整议程揭晓

12月10-11日,2024全球智博会即将盛大开幕。
阅读原文

Day 2:强化微调(RFT)炸场!只需几十条数据就能让o1-mini吊打o1,OpenAI 又双叒叕搞事了!

现在可以用这套强化微调技术,打造属于自己的 GPT-4 专属版本!
阅读原文

OpenAI推出强化微调技术:为特定行业需求打造更精准的 AI 模型

OpenAI 推出了强化微调(Reinforcement Fine-Tuning, RFT),一种新型模型定制技术,能够帮助企业构建高专业性的 AI 模型,应对复杂、领域专属的任务。借助 ...
阅读原文

Meta 推出 Llama 3.3:更小规模、更高性能的开源 AI 模型

Meta 发布开源多语言大型语言模型 Llama 3.3,在大幅降低硬件需求与运行成本的同时实现顶级性能,力求将 AI 的开发与应用推向更高效、环保的未来。
阅读原文

《黑神话》入选《时代》年度 10 大最佳游戏/Kimi 杨植麟发文公开回应近期争议/通用汽车中国多部门裁员三分之一

·苹果 OLED 屏幕路线图曝光\x0d\x0a·哪吒汽车前 CEO 张勇转任公司顾问\x0d\x0a·2028 年「嫦娥八号」将带机器人登月造砖
阅读原文