Stable Audio 2.5

Stable Audio 2.5 是 Stability AI 推出的最新音频生成模型,专为企业级声音制作设计。模型具备快速生成(三分钟音频仅需两秒)、动态音乐创作和音频修复功能。
阅读原文

Live Interpreter API

Live Interpreter API 是 Azure 语音翻译的新功能,能实现实时的多语言语音翻译。无需用户手动设置输入语言, Live Interpreter API 能自动连续识别正在使用...
阅读原文

有了这个AI排版作图工具,我连夜抛弃稿定和可画

前段时间主包去实习,导师随口说起,最近在用一个AI工具,可以一键生成海报。我当时心想:不就是 lovart 那类的AI生图软件吗?还挺不屑。结果没过两天,我用 ...
阅读原文

veCLI

veCLI 是字节跳动火山引擎推出的命令行 AI 工具,提升开发效率。无缝集成豆包大模型 1.6 等多种模型,开发者可通过自然语言交互,快速生成代码并完成本地部署...
阅读原文

图像生成告别AI味!清华、港中大、腾讯混元联手推出SRPO新方法,美观、逼真、艺术感都有了

算泥社区是集 “AI 大模型开发服务 + 算法 + 算力” 于一体的开源生态社区,欢迎关注!文本到图像生成技术近年来取得了令人瞩目的进展。从DALL-E,Midjourney,...
阅读原文

腾讯ima开源了,人人都能本地部署!

大家好,我是Cita(西塔),一名程序员,致力于在AI时代成为Vibe Coding(氛围编程)的资深大佬,带领上万人学会AI编程。点击下方名片关注公众号,领取AI资料包...
阅读原文

MobileLLM-R1

MobileLLM-R1是Meta推出的一系列专为数学、编程和科学推理设计的高效推理模型。系列包含基础模型和最终模型,分别有1.4亿、3.6亿和9.5亿参数版本。模型并非通...
阅读原文

Oboe

Oboe 是 Spotify 前高管创立的 AI 驱动的个性化学习平台。用户只需输入一个关键词或主题,Oboe 能在几秒钟内生成一门量身定制的课程,涵盖科学、历史、外语、...
阅读原文

谁是AI生图新王?Nano Banana和Seedream4.0,两大模型实测,海报大PK!

前几天Nano Banana爆火之后,字节也发布了Seedream4.0。这两大生图模型,谁才是生图新的王者?Lovart在第一时间接入了两大模型,今天就在Lovart里直接操作案...
阅读原文

Nano Banana的20种高级感满满的影楼级别摄影提示词让你的作品直接出圈

上一篇小宙分享了10组纳米蕉高级肖像拍摄提示词(男生篇)随手拍也能变大片?Nano Banana 把普通男生照玩出了高级感,受到了大家的喜欢,很多网友私信说能不能更...
阅读原文

AgentCLUE-ICabin

AgentCLUE-ICabin 是专注于汽车智能座舱场景的 AI 智能体测评基准,全面评估大语言模型在智能座舱中的工具调用能力。基准基于12大常见用车场景构建,覆盖从日...
阅读原文

IndexTTS2

IndexTTS2是B站语音团队开发的新型文本转语音(TTS)模型,已经正式开源。模型在情感表达和时长控制方面实现了重大突破,是首个支持精确时长控制的自回归TTS...
阅读原文

Stand-In

Stand-In 是腾讯微信视觉团队推出的轻量级的视频生成框架,专注于生成身份保护视频。框架通过训练1%的基础模型参数,能生成高保真度、身份一致的视频,且具有...
阅读原文

ST-Raptor

ST-Raptor 是用在半结构化表格问答的工具,仅需一个 Excel 格式的表格和一个自然语言问题作为输入,能产生精确的答案。
阅读原文

Strix

Strix 是开源的 AI 驱动安全测试工具,能帮助开发人员和安全团队快速发现、验证应用程序中的漏洞。工具通过模拟真实黑客攻击,动态运行代码,减少误报。
阅读原文
19101112131,565