Claude 3.7硬控马里奥90秒,GPT-4o开局暴毙!Karpathy直呼基准失效,游戏成LLM新战场

原标题:Claude 3.7硬控马里奥90秒,GPT-4o开局暴毙!Karpathy直呼基准失效,游戏成LLM新战场 文章来源:新智元 内容字数:3651字AI评估新标准:游戏测试的兴...
阅读原文

历时6个月,Hugging Face开源LLM「超大规模实战手册」!200页3万字4000次训练

原标题:历时6个月,Hugging Face开源LLM「超大规模实战手册」!200页3万字4000次训练 文章来源:新智元 内容字数:12389字Hugging Face超大规模训练手册:民...
阅读原文

最新「大语言模型简史」整理!从Transformer(2017)到DeepSeek-R1(2025)

本文回顾LLM的发展历程,以2017年具有革命性意义的Transformer架构为起点。
阅读原文

Avat3r

Avat3r 是慕尼黑工业大学和 Meta Reality Labs 推出的高保真三维头部头像的大型可动画高斯重建模型,仅需几张输入图像,能生成高质量且可动画化的 3D 头部头...
阅读原文

WhisperChain

WhisperChain 是开源的语音识别工具,基于语音输入提升工作效率。WhisperChain用 Whisper.cpp 实现实时语音识别,将语音转换为文本,基于 LangChain 对文本进...
阅读原文

TurboLearn

Turbolearn 是AI学习工具,基于AI技术将录音和PDF文件转化为高效的学习资料,如笔记、闪卡、测验和播客。Turbolearn支持笔记中插入表格、表情符号、图表和公...
阅读原文

星火医疗大模型X1

星火医疗大模型X1是科大讯飞发布的深度推理大模型,专门针对医疗领域设计,具备强大的复杂问题处理能力。模型通过深度推理算法,能逐步解释循证过程,显著降...
阅读原文

T2V-01-Director

T2V-01-Director 是海螺AI(MiniMax)推出的文本到视频生成工具,专注于通过自然语言指令实现精准的镜头运动控制。支持用户在生成视频时,通过简单的文字描述...

LangChain实战 | MultiQueryRetriever 让 RAG 更懂你的问题

MultiQueryRetriever是 LangChain 提供的一种增强检索工具,能够通过生成多个查询变体提高召回率,解决单一查询匹配度不足的问题。它适用于模糊查询、开放域...
阅读原文

部分国产芯片适配满血版 DeepSeek,仍「遥遥无期」

国内最强AI芯片公司,适配满血版 DeepSeek 的目标是 25 Tokens/s。
阅读原文

阿里开源最新、最强大的视频生成模型万相2.1一手实测

原标题:阿里开源最新、最强大的视频生成模型万相2.1一手实测 文章来源:科技未来派 内容字数:2286字阿里巴巴万相2.1:开源AI视频生成模型,引领行业新风向 ...
阅读原文

AI.com 挂牌出售,天价要价 1 亿美元!

Larry Fischer 是一位语速飞快的纽约人,他在域名大宗交易领域战绩累累,包括 2014 年将 Messenger.com 卖给 Facebook 和 2020 年将 Teams.com 卖给 Microsof...
阅读原文

鸿海将独家承接美国“星际之门”计划的AI服务器代工订单

台湾经济日报消息,据消息人士透露,美国正加速推进总投资高达5,000亿美元的\x26quot;星际之门计划\x26quot;(Stargate Project),鴻海集团可能将独家获得该...
阅读原文

入选ICLR 2025!浙大沈春华等人提出玻尔兹曼对齐技术,蛋白质结合能预测达SOTA

将蛋白质发生突变时结合自由能的变化与氨基酸序列出现的可能性联系起来
阅读原文