AI项目和框架

RedInk

RedInk(红墨)是开源的AI小红书图文生成工具,致力于简化内容创作流程。用户输入主题后,工具能快速生成吸睛标题、优质正文和精美配图,实现“一句话生成一套...
阅读原文

HY-Motion 1.0

HY-Motion 1.0(混元Motion 1.0)是腾讯混元团队开源的十亿参数级文本到 3D 动作生成大模型。基于 Diffusion Transformer(DiT)架构与流匹配机制,仅需一句...
阅读原文

AutoMV

AutoMV 是M-A-P、北京邮电大学、南京大学NJU-LINK实验室等机构开发的自动化多智能体系统,支持将歌曲转化为连贯、与节奏对齐的音乐视频。系统通过音乐信息检...
阅读原文

Tencent-HY-MT1.5

Tencent-HY-MT1.5 是腾讯混元开源的翻译模型,包含两个版本Tencent-HY-MT1.5-1.8B 和 Tencent-HY-MT1.5-7B。模型支持33种国际语言互译及5种民汉/方言翻译,覆...
阅读原文

PersonaLive

PersonaLive 是澳门大学和 GVC 实验室开源的实时数字人直播工具。工具能在单张 12GB 显存的消费级显卡上运行,实现无限时长的肖像动画生成,支持低延迟互动。
阅读原文

Yume1.5

Yume1.5 是上海人工智能实验室和复旦大学等推出的交互式世界生成模型,能从单张图像或文本提示生成逼真、连续且可探索的虚拟世界。
阅读原文

Step-DeepResearch

Step-DeepResearch是阶跃星辰推出的32亿参数深度研究AI模型,能在单次推理中完成复杂研究任务并生成专业报告。模型采用单体架构设计,通过规划、深度搜索、反...
阅读原文

MAI-UI

MAI-UI 是通义实验室推出的全尺寸 GUI 智能体基座模型,具备用户交互、工具调用和端云协同三大核心能力。框架通过自主进化数据管线和大规模在线强化学习技术...
阅读原文

InstanceAssemble

InstanceAssemble 是小红书与复旦大学联合推出的轻量级的布局到图像生成框架。框架通过创新的“实例组装注意力”机制,实现从简单到复杂、从稀疏到密集布局的精...
阅读原文

Zen Browser

Zen Browser 是基于Firefox 内核的开源浏览器,能通过高效的设计和强大的功能提升用户生产力。Zen Browser用垂直标签页和侧边栏布局,优化宽屏显示器的使用体...
阅读原文

QwenLong-L1.5

QwenLong-L1.5 是阿里通义实验室推出的专注于长文本推理的大语言模型。模型基于 Qwen3-30B-A3B 架构,通过系统化的后训练方案,显著提升长文本推理能力。
阅读原文

ML-Master 2.0

ML-Master 2.0 是上海交通大学人工智能学院、上海算法创新研究院、深势科技组成的SciMaster团队推出的面向真实机器学习科研任务的自主智能体。ML-Master 2.0...
阅读原文

Infographic

Infographic 是阿里前端 AntV 团队开源的新一代信息图框架。框架基于 G2 可视化引擎和 Ant Design,能快速生成高质量、稳定的信息图。
阅读原文

FrontierScience

FrontierScience是OpenAI推出的科学AI能力评估基准,专门测试大模型在物理、化学、生物领域的专家级推理能力。包含两个子集:奥林匹克赛道(100道竞赛级短答...
阅读原文

QuantiPhy

QuantiPhy 是斯坦福大学李飞飞团队推出的首个量化评估视觉 - 语言模型(VLM)物理推理能力的基准。QuantiPhy 通过 3300 多个视频 - 文本实例,要求模型基于视...
阅读原文
12345165