HunyuanCustom

HunyuanCustom是腾讯混元团队推出的多模态驱动的定制化视频生成框架。HunyuanCustom支持图像、音频、视频和文本等多种输入条件,支持生成具有特定主体和场景...
阅读原文

今天学点啥

今天学点啥是秘塔AI推出的创新AI学习工具。用户只需输入关键词、上传文档或粘贴网页链接,AI能自动将内容转化为个性化的互动课程,生成配套PPT和讲解语音。
阅读原文

ICEdit

ICEdit(In-Context Edit)是浙江大学和哈佛大学推出的指令式图像编辑框架。基于大规模扩散变换器(Diffusion Transformer)的强大生成能力和上下文感知能力...
阅读原文

DBCopilot

DBCopilot 是火山引擎推出的国内首个数据库智能助手,上线于火山引擎数据库工作台 DBW 控制台。通过 AI 技术覆盖数据存储、管理、获取三大核心场景,结合基础...
阅读原文

Granite 4.0 Tiny Preview

Granite 4.0 Tiny Preview 是 IBM 推出的 Granite 4.0 语言模型家族中最小的模型的预览版本。Granite 4.0 Tiny Preview用极高的计算效率和紧凑的模型结构为特...
阅读原文

Gemini 2.5 Pro (I/O 版)

Gemini 2.5 Pro (I/O 版) 是 Google 推出的 Gemini 2.5 Pro 升级版多模态AI模型,具体版本号为 Gemini 2.5 Pro Preview 05-06。模型在编程能力上取得重大突破...
阅读原文

VPP

VPP(Video Prediction Policy)是清华大学和星动纪元推出的首个AIGC机器人大模型。基于预训练的视频扩散模型,学习互联网上的大量视频数据,直接预测未来场...
阅读原文

Amazon Nova Premier

Amazon Nova Premier 是亚马逊推出功能最强大的多模态 AI 模型,能处理文本、图像和视频输入(不包括音频),擅长处理需要深度理解上下文、多步骤规划以及跨...
阅读原文

攻壳智能体

攻壳智能体是专注于智能体和 AI 工具的门户网站,为用户介绍最新、热门的智能体和 AI 工具,帮助用户快速找到适合自己的学习、工作、生活的 AI 利器。通过精...
阅读原文

D-DiT

D-DiT(Dual Diffusion Transformer)是卡内基梅隆大学、耶鲁大学和字节跳动Seed实验室推出的多模态扩散模型,能统一图像生成和理解任务。模型结合连续图像扩...
阅读原文

NoteLLM

NoteLLM 是小红书推出的针对笔记推荐的多模态大型语言模型框架。NoteLLM 基于生成笔记的压缩嵌入和自动生成标签类别,用大型语言模型(LLM)的强大语义理解能...
阅读原文

kimi-thinking-preview

kimi-thinking-preview 是月之暗面推出的多模态思考模型,具备深度推理能力,擅长解决复杂问题,如代码、数学和工作难题。模型基于 reasoning_content 字段展...
阅读原文

Text2CAD

Text2CAD 是创新的在线平台,通过人工智能技术将自然语言描述快速转化为专业 CAD 模型。用户只需用简单的语言描述设计想法,如尺寸、形状和功能要求,Text2CA...
阅读原文

3DV-TON

3DV-TON(Textured 3D-Guided Consistent Video Try-on via Diffusion Models)是阿里巴巴达摩院、湖畔实验室和浙江大学联合推出的基于扩散模型的视频虚拟试...
阅读原文

ACE-Step

ACE-Step 是 ACE Studio 和 StepFun 联合推出的开源音乐生成基础模型,基于创新的架构设计实现高效、连贯且可控的音乐创作。ACE-Step结合扩散模型、深度压缩...
阅读原文