Oboe

Oboe 是 Spotify 前高管创立的 AI 驱动的个性化学习平台。用户只需输入一个关键词或主题,Oboe 能在几秒钟内生成一门量身定制的课程,涵盖科学、历史、外语、...
阅读原文

谁是AI生图新王?Nano Banana和Seedream4.0,两大模型实测,海报大PK!

前几天Nano Banana爆火之后,字节也发布了Seedream4.0。这两大生图模型,谁才是生图新的王者?Lovart在第一时间接入了两大模型,今天就在Lovart里直接操作案...
阅读原文

Nano Banana的20种高级感满满的影楼级别摄影提示词让你的作品直接出圈

上一篇小宙分享了10组纳米蕉高级肖像拍摄提示词(男生篇)随手拍也能变大片?Nano Banana 把普通男生照玩出了高级感,受到了大家的喜欢,很多网友私信说能不能更...
阅读原文

AgentCLUE-ICabin

AgentCLUE-ICabin 是专注于汽车智能座舱场景的 AI 智能体测评基准,全面评估大语言模型在智能座舱中的工具调用能力。基准基于12大常见用车场景构建,覆盖从日...
阅读原文

IndexTTS2

IndexTTS2是B站语音团队开发的新型文本转语音(TTS)模型,已经正式开源。模型在情感表达和时长控制方面实现了重大突破,是首个支持精确时长控制的自回归TTS...
阅读原文

Stand-In

Stand-In 是腾讯微信视觉团队推出的轻量级的视频生成框架,专注于生成身份保护视频。框架通过训练1%的基础模型参数,能生成高保真度、身份一致的视频,且具有...
阅读原文

ST-Raptor

ST-Raptor 是用在半结构化表格问答的工具,仅需一个 Excel 格式的表格和一个自然语言问题作为输入,能产生精确的答案。
阅读原文

Strix

Strix 是开源的 AI 驱动安全测试工具,能帮助开发人员和安全团队快速发现、验证应用程序中的漏洞。工具通过模拟真实黑客攻击,动态运行代码,减少误报。
阅读原文

HuMo

HuMo是清华大学和字节跳动智能创作实验室共同提出的多模态视频生成框架,专注于人类中心的视频生成。能从文本、图像和音频等多种模态输入中生成高质量、精细...
阅读原文

FireRedTTS-2

FireRedTTS-2 是先进的长格式流式文本转语音(TTS)系统,专注于多说话人对话生成。采用12.5Hz流式语音分词器和双Transformer架构,能实现低延迟、高保真、多...
阅读原文

纳米P视频

这几天 Nano Banana 把P图玩出花了,没想到纳米AI更牛,直接就能P视频。一句话,换主角、换商品、改场景、改音效、对口型,纳米P视频智能体和AI视频编辑器无...
阅读原文

小美

小美是美团正式发布的首款AI生活Agent。定位为“小而美的AI生活小秘书”,通过自然语言交互为用户提供便捷的生活服务。小美能快速响应用户指令,完成外卖点单、...
阅读原文

SRPO

SRPO(Semantic Relative Preference Optimization)是腾讯混元推出的文本到图像生成模型,通过将奖励信号设计为文本条件信号,实现对奖励的在线调整,减少对...
阅读原文

Qwen3-Next

Qwen3-Next是阿里通义开源的新一代混合架构大模型,包含指令版(Qwen3-Next-80B-A3B-Instruct )和思维版(Qwen3-Next-80B-A3B-Thinking)两个版本。
阅读原文

DeepTracker

DeepTracker是AI情报助手,能将零散信息整理成清晰答案。能抓住关键信息,生成“事件→影响→可能结果”的逻辑链,辅助快速精准决策。使用时,只需输入公司、事件...
阅读原文