Music 2.0

Music 2.0 是MiniMax最新推出的先进音乐创作模型。模型能精准捕捉和还原人声的细腻情绪与器乐的动态张力,支持多种唱法和风格切换,如流行、爵士、摇滚等,还...
阅读原文

Emu3.5

Emu3.5(悟界·Emu3.5)是智源研究院发布的多模态世界大模型。通过在超过10万亿多模态Token(主要源自互联网视频,总时长约790年)上进行端到端预训练,学习并...
阅读原文

Gambo

Gambo 是创新的 AI 游戏开发Agent,定位“世界首个 Game Vibe Coding Agent”。用户只需通过简单的文字描述,能快速生成完整的游戏,包括场景、角色、音效和交...
阅读原文

Firefly Image 5

Firefly Image 5 是 Adobe 发布的最新图像生成模型。具备原生400万像素输出能力,能直接生成高分辨率图像,细节表现力大幅提升。在人物渲染方面,新模型优化...
阅读原文

Speech 2.6

Speech 2.6 是MiniMax推出的全新语音生成模型,专为新一代语音智能体设计,具备超低延时(低于250毫秒),确保实时对话流畅;支持多种语言的网址、邮箱、电话...
阅读原文

FIBO

FIBO 是首个开源的、原生支持 JSON 的文本生成图像模型,专为长结构化描述训练而成。模型在超过 1 亿条结构化 JSON 描述(每条约 1,000 字)上训练,能精确、...
阅读原文

Sonic-3

Sonic-3是Cartesia最新发布的语音AI引擎,是当前市场上速度最快、最自然的实时语音对话模型。采用创新的“状态空间模型”(SSM)架构,非传统的Transformer模型...
阅读原文

SoulX-Podcast

SoulX-Podcast 是 Soul AI Lab 推出的多说话人文本到语音(TTS)模型,专为生成长篇播客对话设计。模型参数为1.7B,支持普通话、英语及多种汉语方言(如四川...
阅读原文

GigaBrain-0

GigaBrain-0 是新型的视觉-语言-行动(VLA)基础模型,由世界模型生成的数据驱动。模型通过大规模生成多样化数据,减少了对真实机器人数据的依赖,显著提升了...
阅读原文

FlowithOS

FlowithOS是Flowith推出的全球首个智能体操作系统,使其能像人类一样与数字世界互动。FlowithOS具备浏览器、终端和脚本使用功能,能自动执行复杂任务,如文件...
阅读原文

Pomelli

Pomelli 是 Google Labs 推出的 AI 营销工具。用户输入品牌网站地址,Pomelli 能在短时间内分析网站的配色、风格等元素,自动生成符合品牌调性的营销文案和图...
阅读原文

Remy

Remy 是Kiri Innovations公司推出的基于3D高斯溅射技术的空间记录应用,用户可通过手机拍摄视频快速生成逼真的3D场景。应用随华为鸿蒙OS 6系统发布,上线后迅...
阅读原文

Mistral AI Studio

Mistral AI Studio 是法国 AI 初创公司 Mistral AI 推出的企业级 AI 应用开发平台,帮助企业将 AI 从原型开发过渡到可靠、可扩展的生产系统。具备三大核心功...
阅读原文

Hailuo 2.3

Hailuo 2.3 是MiniMax推出的先进 AI 视频生成模型,基于 Hailuo 02 升级而来。模型在肢体动作、微表情、风格化表现及物理真实性方面实现显著提升,能生成更加...
阅读原文

Sky

Sky是Shortcuts团队推出的AI驱动的自动化工具,专为Mac设计。工具支持与任何窗口和任何应用程序进行交互,基于自然语言处理和AI技术,帮助用户快速完成任务。
阅读原文
1456781,579