ICLR 2025|南洋理工大学AvatarGO,探索4D人与物体交互生成新方法

这是首次尝试基于文本引导生成具有物体交互的4D虚拟形象。
阅读原文

还得是上海!百亿级大模型项目现场对接,只用3天

新技术、新生态、新挑战、新机遇,正在GDC现场被热议
阅读原文

中科闻歌发布智川X-Agent平台、优雅音视频大模型更新,领先技术加速AI普惠落地

助力政企极速落地AI应用与创意灵感,让AI技术精细化满足真实业务场景
阅读原文

OpenAI 七年霸权为何一夜崩塌?微软撤资1600亿暴露出AI战争终极规则:数据即,推理即战场

原标题:OpenAI 七年霸权为何一夜崩塌?微软撤资1600亿暴露出AI战争终极规则:数据即弹药,推理即战场 文章来源:AI范儿 内容字数:3891字AI竞赛:从算力到数...
阅读原文

OpenAI预计下周推出GPT4.5

近期,据外媒 The Verge 援引知情人士消息,微软正在准备服务器容量以托管 OpenAI 即将推出的 GPT-4.5 和 GPT-5 模型。\x0a此前,OpenAI CEO 山姆·奥特曼曾发...
阅读原文

什么是NSA(Native Sparse Attention)

NSA(Native Sparse Attention )是DeepSeek提出的一种新型稀疏注意力机制,通过算法创新和硬件优化提升长文本建模的效率。核心在于动态分层稀疏策略,结合粗...
阅读原文

OOMOL

OOMOL (悟墨)是基于 VSCode 打造的现代化集成开发环境(IDE),专为工作流自动化而设计。通过拖拽式图形化界面,让用户能直观地搭建复杂的工作流,无需编程...
阅读原文

Evo 2

Evo 2 是美国弧形研究所、英伟达、斯坦福大学等机构合作推出的DNA语言模型,用于基因组建模和设计,覆盖生命的所有领域。Evo 2 基于 StripedHyena 2 架构开发...
阅读原文

Indic Parler-TTS

Indic Parler-TTS 是 Hugging Face 和 AI4Bharat 团队合作推出的多语言文本到语音(TTS)模型,专门用于印度语言和英语的语音合成。Indic Parler-TTS 是 Parl...
阅读原文

AI行业报告免费下载

openi.amirror.ink(AI时代)收集和整理的AI行业的重要报告和资源,供您免费下载学习: 点此一键转存(夸克网盘) AI行业报告 中国互联网信息中心:《生成式人工智...
阅读原文

N倍提升效率!用 Docling 解析多种格式,一键转 Markdown

Docling 旨在简化多种文档格式的解析和转换。它支持读取 PDF、DOCX、PPTX、图像、HTML、AsciiDoc 和 Markdown 等格式,并能将其导出为 Markdown 或 JSON 格式。
阅读原文