AI项目和框架 - 第 3 页

Microsoft Scout

Microsoft Scout 是微软推出的 AI 个人助手，基于 OpenClaw 开源技术构建。工具拥有独立 Entra 身份，可在后台持续自主运行，无需用户逐次触发。

阅读原文

AI工具

1周前

JoyAI-Echo

JoyAI-Echo 是京东推出的开源长音视频生成框架，专为分钟级多镜头故事生成设计。框架通过跨模态记忆库、记忆驱动后训练、Director Agent 对话式编辑和轻量化...

阅读原文

AI工具

1周前

Ideogram 4

Ideogram 4 是 Ideogram 推出的首个开源文本到图像生成模型，拥有 93 亿参数，从头训练非基于现有模型微调。模型专为高质量图像生成而设计，尤其在设计、营销...

阅读原文

AI工具

1周前

PaddleOCR-VL-1.6

PaddleOCR-VL-1.6 是百度飞桨团队推出的文档解析视觉语言模型（VLM），是 PaddleOCR-VL 系列的最新升级版本。

阅读原文

AI工具

1周前

Bernini

Bernini 是字节跳动开源的统一视频生成与编辑框架，采用MLLM 语义规划 + DiT 视觉渲染的两阶段解耦架构。多模态大模型理解指令并规划语义草图，由 Diffusion ...

阅读原文

AI工具

1周前

Science Skills

Science Skills 是谷歌 DeepMind 推出的开源科学技能集合，专为加速 AI Agent 驱动的科学研究工作流设计。工具整合 AlphaGenome、AlphaFold Database、UniPro...

阅读原文

AI工具

1周前

MAI-Thinking-1

MAI-Thinking-1 是微软推出的首款自研高级推理模型。模型采用 35B 活跃参数 / 约 1T 总参数的稀疏 MoE 架构，完全基于干净、商业授权数据从头训练，未使用任...

阅读原文

AI工具

1周前

MAI Transcribe-1.5

MAI-Transcribe-1.5 是微软 AI 团队自研的语音转文本模型，支持 43 种语言，具备上下文感知的关键词偏置能力，模型在 FLEURS 基准测试中取得行业最低的词错...

阅读原文

AI工具

1周前

MAI-Voice-2

MAI-Voice-2 是微软推出的新一代文本转语音（TTS）模型，是微软迄今最具表现力和自然感的语音合成模型。相比前代在保真度、语言覆盖、说话人一致性和情感范围...

阅读原文

AI工具

1周前

MAI-Code-1-Flash

MAI-Code-1-Flash 是微软专为开发者工作流推出的轻量级代码生成模型，深度集成 GitHub Copilot。模型采用自适应输出长度控制技术，在保持高准确率的同时最高...

阅读原文

AI工具

1周前

Odysseus

Odysseus 是开源自托管的 AI 工作空间，提供类似 ChatGPT / Claude 的聊天界面，工具完全本地化运行，数据不出本机、隐私零泄露。

阅读原文

AI工具

1周前

OpenClacky

OpenClacky 是李亚飞团队开源的 AI Agent，支持一键安装与跨平台运行。工具通过精简工具集、智能上下文压缩和模型路由大幅降低使用成本，让专业人士能全天开...

阅读原文

AI工具

2周前

Mellum2

Mellum2 是 JetBrains 开源的面向软件工程系统的新机器学习模型。模型每 token 仅激活 2.5B 参数，专为软件工程 AI 工作流优化，支持代码生成、智能路由、子 ...

阅读原文

AI工具

2周前

ECC

ECC（Everything Claude Code）是跨平台 AI Agent 性能优化系统。系统为 Claude Code、Codex、Cursor 等 7+ 个 AI 编程工具提供 63 个专业 Agent、249 个按需...

阅读原文

AI工具

2周前

Qwen3.7-Plus

Qwen3.7-Plus 是通义千问推出的新一代多模态大模型，将视觉与语言统一为一体化智能体基座。模型能感知真实世界场景、读取屏幕并操作 GUI、基于视觉参考生成代...

阅读原文

AI工具

2周前