UnifoLM-WMA-0

UnifoLM-WMA-0 是宇树科技开源的跨多类机器人本体的世界模型 - 动作架构,专为通用机器人学习设计。核心是世界模型,能理解机器人与环境的物理交互,具备仿真...
阅读原文

真人手办建模!腾讯混元3D 3.0来了

腾讯混元3D 3.0模型,来了!建模精度提升3倍,几何分辨率高达1536³,支持36亿体素超高清建模,细节表现力显著增强,为用户带来前所未有的3D内容创作体验。从...
阅读原文

GPT-5-Codex

GPT-5-Codex 是 OpenAI 推出的专为编程优化的模型,基于 GPT-5 进一步强化。模型聚焦于真实世界的软件工程任务,如从零搭建项目、代码重构、调试、测试和代码...
阅读原文

ROMA

ROMA(Recursive Open Meta-Agent) 是Sentient AGI团队开源的多Agent系统框架,通过递归层次结构将复杂任务拆解为可并行的子任务,由父节点分配给子节点执行...
阅读原文

Grok 4 Fast

Grok 4 Fast是xAI推出的快速版人工智能模型,最大的特点是响应速度快,最高可达标准版的10倍,生成速度每秒75个token,能快速完成简单查询、基础代码生成等任...
阅读原文

Mini-o3

Mini-o3 是字节跳动和香港大学联合推出的开源模型,专为解决复杂的视觉搜索问题而设计。模型通过强化学习和基于图像的工具,能执行深度多轮推理,推理轮次可...
阅读原文

飞书多维表格接入Nano/即梦4.0!带你搭建生图工作流|福利放送

是的,你没看错。强大的飞书多维表格AI字段捷径已经接入Nano-Banana和即梦4.0!今天将带大家体验2种玩法:1、用官方模板免费生成Nano-Banana/即梦4.0爆款2、...
阅读原文

ERNIE-4.5-21B-A3B-Thinking

ERNIE-4.5-21B-A3B-Thinking 是百度推出的专注于推理任务的大型语言模型。采用混合专家(MoE)架构,总参数量达210亿,每个token激活30亿参数,支持128K的长...
阅读原文

FunAudio-ASR

FunAudio-ASR 是阿里巴巴达摩院推出的端到端语音识别大模型,专为解决企业落地中的关键问题设计。通过创新的 Context 增强模块,有效优化了“幻觉”和“串语种”...
阅读原文

xiaohongshu-mcp

xiaohongshu-mcp是基于 Model Context Protocol (MCP) 协议开发的开源工具,帮助用户实现小红书平台的自动化操作。支持多种功能,包括登录小红书、发布图文、...
阅读原文

用即梦4.0直出AI长视频的邪修攻略!我在seko薅商汤羊毛

即梦4.0 免费!Nano 🍌免费!Veo3 五折!真的假的,真让我抢到AI界的鸡蛋了?之前也测过Seko,当时就可以直接完成剧情策划、生成分镜图片和视频、添加配音和背...
阅读原文

别再花钱去拍形象照了,教你一键制作大师级人物摄影照(含提示词和操作方法)

点击蓝字「AI奇妙夜」和「星标」别怕,也别焦虑,我们一起走进AI的世界01引言前两天给大家介绍了如何制作证件照的方法和技巧,还是有挺多朋友感兴趣的。也期...
阅读原文

YouStory

YouStory是智能AI故事书平台,基于人工智能技术为家庭创造独特的成长故事。用户可以通过上传孩子的照片、宠物、绘画、涂鸦或喜欢的玩具来让它们成为故事的主...
阅读原文

ZipVoice

ZipVoice 是小米集团 AI 实验室发布的高效零样本语音合成(TTS)模型。模型基于 Flow Matching 架构,包含 ZipVoice(单说话人)和 ZipVoice-Dialog(对话语...
阅读原文

PP-OCRv5

PP-OCRv5 是百度推出的高效、精准的文字识别模型。模型基于两阶段处理流程,专门用在快速、准确地检测和识别图像中的文字。
阅读原文
1891011121,565