Qwen3-LiveTranslate
Qwen3-LiveTranslate 是阿里通义团队推出的基于大语言模型的多语言实时音视频同传模型。模型支持 18 种语言及多种方言的翻译,具备视觉增强技术,可结合口型...
presentation-ai
presentation-ai 是ALLWEONE团队推出的开源 AI 演示文稿生成工具,能根据用户输入的主题自动生成完整的 PPT 大纲和精美的幻灯片,支持多种语言、主题风格和自...
MagicLight AI
MagicLight AI 是 AI 动画视频创作平台,能将文字故事转化为精彩的动画视频。只需输入故事内容或上传素材,平台自动分析、生成情节结构,创建一致的角色和场...
Tunee – 国内首个对话式音乐创作 Agent,刚上线就好评如潮!
内容编辑丨特工少女 特工炸炸内容审核丨特工小天上周,我们在观猹平台上发现,有一个 AI 音乐创作产品突然收到了众多观猹员的一致好评,许多观猹员写的非常认...
Doubao-Seed-Translation
Doubao-Seed-Translation 是字节跳动团队推出的先进多语言翻译模型,支持 28 种语言互译,涵盖中英、日韩、德法等多种常用语言。
DeepSeek-V3.1-Terminus
DeepSeek-V3.1-Terminus 是 DeepSeek 团队推出的人工智能语言模型,是 DeepSeek-V3.1 的升级版本,主要优化语言一致性和 Agent 能力,解决中英文混杂及异常字...
Qwen3-Omni
Qwen3-Omni是阿里通义团队推出的业界首个原生端到端全模态AI模型,能无缝处理文本、图像、音频和视频等多种模态数据。模型在36项音频及音视频基准测试中22项...
Qwen3-TTS-Flash
Qwen3-TTS-Flash 是阿里通义推出的支持多音色、多语言和多方言的旗舰语音合成模型。模型具备卓越的中英语音稳定性,出色的多语言性能,及高表现力的拟人音色。
Qianfan-VL
Qianfan-VL是百度智能云千帆推出的面向企业级多模态应用场景的视觉理解大模型。模型包含3B、8B和70B三种尺寸版本,具备出色的通用能力和针对OCR、教育等垂直...
LatticeWorld
LatticeWorld 是网易、香港城市大学、北京航空航天大学和清华大学等机构推出的将大语言模型与工业级 3D 渲染引擎虚幻引擎 5 (Unreal Engine 5,UE5)结合的...