Evoker

Evoker 是一站式 AI 创作平台,激发创意灵感并加速创作过程。支持文本、图像和视频生成,提供多模态创作体验。用户可以在一个聊天框中轻松创作和完善作品,平...
阅读原文

开源进阶版Nano Banana UI,支持局部涂选、连续编辑,比官方更好用。

Nano Banana最近大家应该都玩的很溜了,搞来搞去就那些玩法,可能新鲜感也弱了些。AI大部分的新东西都有这个特点,刚出来的时候大家都感觉很有趣,跟风去玩,...
阅读原文

InfiniteTalk

InfiniteTalk是美团视觉智能部推出的新型数字人驱动技术,通过稀疏帧video dubbing范式,仅需少量关键帧能驱动数字人人生成自然流畅的视频,解决传统技术中口...
阅读原文

LLaSO

LLaSO(Large Language and Speech Model)是北京深度逻辑智能科技有限公司推出的全球首个完全开源的语音模型,能解决大型语音语言模型(LSLM)领域长期存在...
阅读原文

混元3D 3.0

混元3D 3.0是腾讯最新发布的先进的3D生成模型。采用了首创的3D-DiT分级雕刻技术,能生成超高清的3D几何结构,建模精度提升3倍,几何分辨率高达1536³,支持36...
阅读原文

清华炸场!AI 大模型天梯榜来了,选模型不再头秃。

周六在杭州有一个 GOSIM 大会。这个大会上,清华大学联合中软评测中心发布了《2025 大模型服务性能排行榜》。这个排行榜挺有意思的,它不是对比各个 AI 大模...
阅读原文

GPT-5-Codex 发布,可以7小时连续编程,但OpenAI 封杀了API。。

凌晨一点,OpenAI 发布了 GPT-5-Codex,但这次,所有想调用 API 的开发者可能要失望了。OpenAI 做了一个决定:Codex 并不通过 API 开放。你不能靠 key 来偷偷...
阅读原文

Lumina-DiMOO

Lumina-DiMOO是上海人工智能实验室等机构开源的新一代多模态生成与理解模型。模型采用全离散扩散架构,统一处理文本、图像等多模态数据,支持文本到图像生成...
阅读原文

UnifoLM-WMA-0

UnifoLM-WMA-0 是宇树科技开源的跨多类机器人本体的世界模型 - 动作架构,专为通用机器人学习设计。核心是世界模型,能理解机器人与环境的物理交互,具备仿真...
阅读原文

真人手办建模!腾讯混元3D 3.0来了

腾讯混元3D 3.0模型,来了!建模精度提升3倍,几何分辨率高达1536³,支持36亿体素超高清建模,细节表现力显著增强,为用户带来前所未有的3D内容创作体验。从...
阅读原文

GPT-5-Codex

GPT-5-Codex 是 OpenAI 推出的专为编程优化的模型,基于 GPT-5 进一步强化。模型聚焦于真实世界的软件工程任务,如从零搭建项目、代码重构、调试、测试和代码...
阅读原文

ROMA

ROMA(Recursive Open Meta-Agent) 是Sentient AGI团队开源的多Agent系统框架,通过递归层次结构将复杂任务拆解为可并行的子任务,由父节点分配给子节点执行...
阅读原文

Grok 4 Fast

Grok 4 Fast是xAI推出的快速版人工智能模型,最大的特点是响应速度快,最高可达标准版的10倍,生成速度每秒75个token,能快速完成简单查询、基础代码生成等任...
阅读原文

Mini-o3

Mini-o3 是字节跳动和香港大学联合推出的开源模型,专为解决复杂的视觉搜索问题而设计。模型通过强化学习和基于图像的工具,能执行深度多轮推理,推理轮次可...
阅读原文

飞书多维表格接入Nano/即梦4.0!带你搭建生图工作流|福利放送

是的,你没看错。强大的飞书多维表格AI字段捷径已经接入Nano-Banana和即梦4.0!今天将带大家体验2种玩法:1、用官方模板免费生成Nano-Banana/即梦4.0爆款2、...
阅读原文