AI项目和框架

Gemini 3.5 Live Translate

Gemini 3.5 Live Translate 是 Google 推出的最新实时翻译模型,支持 70+ 种语言的近实时语音到语音翻译。
阅读原文

BigSet

Bigset 是美国初创公司 TinyFish 推出的开源多智能体系统,采用 AGPL-3.0 协议。用户只需用自然语言描述所需数据,系统可自动推断表结构、派遣智能体从实时网...
阅读原文

新程Alpha

新程Alpha是Nextie(明日新程)推出的行业首个认知模型,仅4B参数即可端侧部署。模型由"小冰之父"李笛带队,基于开源推理模型通过强化学习解耦知识...
阅读原文

U2

U2 是云知声推出的面向个人、开发者与组织的原生智能体大模型,拥有 2660 亿参数却达到 1.2 万亿参数级性能。
阅读原文

WBench

WBench 是美团 LongCat 团队推出的,首个面向交互式视频世界模型的系统性多轮评测基准,包含 289 个测试案例和 1058 个交互轮次,覆盖自然、城市、幻想等 6 ...
阅读原文

ABot-Earth 0.5

ABot-Earth 0.5是阿里巴巴集团旗下高德推出的全球首个3D原生城市世界模型,定位为自动化3D城市工厂。用户输入单张卫星图像或文字描述,系统可在消费级GPU上10...
阅读原文

Kairos-HomeWorld

Kairos-HomeWorld 是大晓机器人联合香港中文大学与深圳河套学院推出的全球首个全屋三维可交互世界模型。模型通过四阶段分层生成架构,实现从文本到结构连贯、...
阅读原文

VitaBench 2.0

VitaBench 2.0 是美团 LongCat 团队推出的首个真实生活场景下长期动态用户建模智能体评测基准,包含 56 名拟真用户、819 个复杂任务、超 2000 个动态偏好及 6...
阅读原文

Open Code Review

Open Code Review 是阿里巴巴开源的 AI 代码审查 CLI 工具,源自集团内部服务数万名开发者、执行超百万次审查任务的生产级实践。
阅读原文

PlanningBench

PlanningBench 是腾讯混元团队联合中国人民大学高瓴人工智能学院等机构推出的开源框架,专注于大语言模型的规划能力评测与训练。
阅读原文

Magenta RealTime 2

Magenta RealTime 2(MRT2)是谷歌 Magenta 团队推出的第二代开源本地实时音乐生成模型。MRT2 基于逐帧生成架构,每帧 40 毫秒,实现约 200 毫秒的实际控制延...
阅读原文

html-video

html-video 是 OpenDesign 团队(nexu.io)开源的HTML版剪映,基于 hyperframes 框架构建。工具让 Agent 通过写 HTML 可生成世界级水准的产品宣传、知识解说...
阅读原文

PawBench

PawBench 是通义实验室推出的通用智能体评测基准,面向个人助理与 Agent 场景,将底座模型与运行框架(Harness)纳入同一评测体系。
阅读原文

Gemma 4 12B

Gemma 4 12B是谷歌开源的多模态大模型,采用业界首个无编码器统一架构,视觉和音频数据直接输入LLM主干,彻底砍掉独立编码器。
阅读原文

BrowserAct Skills

BrowserAct Skills 是面向 AI Agent 的浏览器自动化 CLI 工具,能解决 Agent 操控浏览器时的核心痛点,无 Cookie 环境、反爬拦截、验证码阻断、人机协作断层等。
阅读原文
1234196