AI项目和框架

EXAONE 3.5:LG推出的开源AI模型助力精准长文本处理与幻觉问题减少

EXAONE 3.5是LG AI研究院推出的开源AI模型,包含24亿、78亿和320亿参数的三个版本。EXAONE 3.5擅长长文本处理,在基准测试中表现优异,特别是在实际应用、长...
阅读原文

中科院联合美团推出的交互式驾驶世界模型数据集

DrivingDojo是中国科学院自动化研究所与美团无人车团队合作推出的数据集,用在训练和研究复杂的自动驾驶交互式世界模型。数据集包含18,000个视频片段,覆盖完...
阅读原文

上海大合腾讯等高校推出的3D服装生成技术

ClotheDreamer是上海大学、上海交通大学、复旦大学和腾讯优图实验室共同推出的3D服装生成技术,能根据文本描述生成高保真、可穿戴的3D服装资产。ClotheDreame...
阅读原文

构建视频智能体AI框架,用自然语言执行搜索、总结等复杂视频任务

Director是构建视频智能体的框架,用户能用自然语言命令执行复杂的视频任务,如视频搜索、编辑、合成和生成,并能即时流式传输结果。基于VideoDB的“视频即数...
阅读原文

DeepSeek V2.5 的最终版微调模型,支持联网搜索

DeepSeek-V2.5-1210是DeepSeek 推出的 DeepSeek V2 系列收官AI模型,DeepSeek V2.5 的最终版微调模型。模型基于Post-Training迭代,在数学、编程、写作和角色...
阅读原文

AI视频修复处理工具,修复缺失、支持四倍超分辨率

VISION XL是高效的视频修复和超分辨率工具,基于潜在扩散模型技术,专注于解决高清视频的逆问题。工具能修复视频缺失部分、去除模糊,显著提升视频清晰度,最...
阅读原文

SPDL:高效便捷的开源AI模型数据加载解决方案助力深度学习创新

SPDL(Scalable and Performant Data Loading)是 Meta AI 推出的开源数据加载工具,能提高 AI 模型训练效率。基于多线程技术,实现高吞吐量数据加载,减少计...
阅读原文

Adobe 联合 MIT 推出的自回归实时视频生成技术

CausVid是Adobe和MIT共同推出的自回归实时视频生成技术,能实现视频的即时播放。基于蒸馏预训练的双向扩散模型构建出自回归生成模型,减少视频生成的延迟,首...
阅读原文

GenMAC:多代理协作框架推动文本到视频生成技术的创新与应用

GenMAC是香港大学、清华大学和微软研究院推出的多代理协作的迭代框架,用在解决文本到视频生成中的复杂场景生成问题。基于将任务分解为设计、生成和重新设计...
阅读原文

开源AI会议助手,提供实时建议、智能摘要、快速回顾关键信息

Amurex是AI会议助手,基于实时建议、智能摘要、关键要点提取、迟到加入回顾和完整会议记录等功能,帮助用户提升会议效率。作为开源工具,Amurex强调透明度、...
阅读原文

北大健康推出的 AI 健康科普应用

易健EasyHealth是北京大学健康传播专业师生推出的微信小程序,基于大语言模型技术打造的健康科普智能问答系统。程序提供AI智能问答、情感智能算法、健康档案...
阅读原文

智源研究院开源的无标注视频学习3D生成模型

See3D(See Video, Get 3D)是北京智源人工智能研究院推出的3D生成模型,能基于大规模无标注的互联网视频进行学习,实现从视频中生成3D内容。与传统依赖相机...
阅读原文

谷歌推出的最强量子芯片,成功解决30年纠错难题

Willow 量子芯片是谷歌最新推出的具有105个物理量子比特,在量子纠错和计算效率上取得了显著突破。Willow成功解决了量子计算领域近30年的纠错难题,实现了在...
阅读原文

微软和马里兰大学共同开源的多模态大语言模型

Florence-VL是创新的多模态大型语言模型(MLLMs),是马里兰大学和微软研究院共同推出的。Florence-VL用生成式视觉基础模型Florence-2丰富视觉表示,能捕捉图...
阅读原文

开源AI虚拟试衣工具,智能适配性别和体型自动调整衣物

OOTDiffusion是开源的AI虚拟试衣工具,能智能适配不同性别和体型,自动调整衣物尺寸和形状,生成自然贴合的试穿效果。OOTDiffusion支持半身和全身试穿模式,...
阅读原文
19091929394148