Qwen3-LiveTranslate

Qwen3-LiveTranslate 是阿里通义团队推出的基于大语言模型的多语言实时音视频同传模型。模型支持 18 种语言及多种方言的翻译,具备视觉增强技术,可结合口型...
阅读原文

可灵2.5 Turbo

可灵2.5 Turbo是可灵团队推出的最新AI视频生成模型,在多个方面实现了显著的升级和优化。性能提升是其核心亮点之一。模型能更好地理解复杂的因果关系和时间序...
阅读原文

presentation-ai

presentation-ai 是ALLWEONE团队推出的开源 AI 演示文稿生成工具,能根据用户输入的主题自动生成完整的 PPT 大纲和精美的幻灯片,支持多种语言、主题风格和自...
阅读原文

MagicLight AI

MagicLight AI 是 AI 动画视频创作平台,能将文字故事转化为精彩的动画视频。只需输入故事内容或上传素材,平台自动分析、生成情节结构,创建一致的角色和场...
阅读原文

Tunee – 国内首个对话式音乐创作 Agent,刚上线就好评如潮!

内容编辑丨特工少女 特工炸炸内容审核丨特工小天上周,我们在观猹平台上发现,有一个 AI 音乐创作产品突然收到了众多观猹员的一致好评,许多观猹员写的非常认...
阅读原文

Lessie AI

Lessie AI 是全球第一个People Search AI Agent,帮你链接任何人、链接世界,专注于网红营销的 AI 工具,目前处于免费测试阶段,用户每月可享受 1500 次网红...
阅读原文

Doubao-Seed-Translation

Doubao-Seed-Translation 是字节跳动团队推出的先进多语言翻译模型,支持 28 种语言互译,涵盖中英、日韩、德法等多种常用语言。
阅读原文

MiroMind

MiroMind 是陈天桥推出的专注于AI领域的平台,致力开发全球顶尖的预测型大模型,核心产品包括 MiroThinker 和 MiroFlow。MiroThinker 是开源的深度研究模型,...
阅读原文

DeepSeek-V3.1-Terminus

DeepSeek-V3.1-Terminus 是 DeepSeek 团队推出的人工智能语言模型,是 DeepSeek-V3.1 的升级版本,主要优化语言一致性和 Agent 能力,解决中英文混杂及异常字...
阅读原文

Qwen3-Omni

Qwen3-Omni是阿里通义团队推出的业界首个原生端到端全模态AI模型,能无缝处理文本、图像、音频和视频等多种模态数据。模型在36项音频及音视频基准测试中22项...
阅读原文

Qwen3-TTS-Flash

Qwen3-TTS-Flash 是阿里通义推出的支持多音色、多语言和多方言的旗舰语音合成模型。模型具备卓越的中英语音稳定性,出色的多语言性能,及高表现力的拟人音色。
阅读原文

Qianfan-VL

Qianfan-VL是百度智能云千帆推出的面向企业级多模态应用场景的视觉理解大模型。模型包含3B、8B和70B三种尺寸版本,具备出色的通用能力和针对OCR、教育等垂直...
阅读原文

Ray3

Ray3是Luma AI推出的新一代视频生成模型,具备强大的推理能力和专业级HDR视频生成技术,为视频创作带来了革命性的变化。Ray3能理解图像和语言指令,执行复杂...
阅读原文

LatticeWorld

LatticeWorld 是网易、香港城市大学、北京航空航天大学和清华大学等机构推出的将大语言模型与工业级 3D 渲染引擎虚幻引擎 5 (Unreal Engine 5,UE5)结合的...
阅读原文

Loomi

Loomi 是专为创作者设计的 AI 工具,通过 20 多个专家智能体,覆盖内容生产的全流程,从话题洞察、受众画像到创作策略,全方位支持创作者。自研的 Nexus 情境...
阅读原文