InternVLA·M1

InternVLA·M1 是上海人工智能实验室开发的具身操作“大脑”,是面向指令跟随的双系统操作大模型。构建了覆盖“思考-行动-自主学习”的完整闭环,负责高阶的空间推...
阅读原文

Learn Your Way

Learn Your Way是谷歌推出的基于先进人工智能技术重新构想传统教材的实验性学习工具。将教材内容转化为动态且引人入胜的学习体验,为每个学习者量身定制。工...
阅读原文

SuperDesign – 首个开源的IDE内置设计Agent,设计+开发效率翻倍。

超级设计就是超级代理。超级代理就是超级开发。超级开发就是超级落地。已经被罗永浩的段子洗脑了,今天给大家推荐的项目是SuperDesign,翻译过来就是超级设计...
阅读原文

VLAC

VLAC是上海人工智能实验室发布的具身奖励大模型。以InternVL多模态大模型为基础,融合互联网视频数据和机器人操作数据,为机器人在真实世界中的强化学习提供...
阅读原文

Orchids

Orchids 是全球首款具备全栈开发能力的 AI 工具,能实现从前端到后端的全流程开发。工具在 UI 设计和全栈开发性能上表现卓越,超越多个主流竞品,如 Lovable...
阅读原文

RustGPT

RustGPT 是用 Rust 编写的 Transformer 架构语言模型。RustGPT从零开始构建,不依赖任何外部机器学习框架,仅用 ndarray 进行矩阵运算。
阅读原文

PromptEnhancer

PromptEnhancer是腾讯混元团队开源的用在提升文本到图像(T2I)模型的提示重写框架,通过思维链(Chain-of-Thought,CoT)提示重写和专用的奖励模型AlignEval...
阅读原文

MasterGo Agent

MasterGo Agent是MasterGo AI推出的全球首个数字界面生产级AI Agent,支持基于设计系统(DSM)的文生UI,能调用团队已有设计规范,实现高效协作和生产。
阅读原文

Nano Bananary

Nano Bananary(香蕉超市) 是开源的图像编辑工具,基于 Google Gemini 图像模型开发,支持中文界面和明暗主题切换,提供 50 多种图像转换效果,无需复杂提示...
阅读原文

数说Social Research

数说Social Research 是数说故事旗下的全能营销 Agent 工具,依托领先大模型技术,接入海量社交媒体数据,能快速解答营销、市场、消费者口碑等专业问题并生成...
阅读原文

Evoker

Evoker 是一站式 AI 创作平台,激发创意灵感并加速创作过程。支持文本、图像和视频生成,提供多模态创作体验。用户可以在一个聊天框中轻松创作和完善作品,平...
阅读原文

InfiniteTalk

InfiniteTalk是美团视觉智能部推出的新型数字人驱动技术,通过稀疏帧video dubbing范式,仅需少量关键帧能驱动数字人人生成自然流畅的视频,解决传统技术中口...
阅读原文

LLaSO

LLaSO(Large Language and Speech Model)是北京深度逻辑智能科技有限公司推出的全球首个完全开源的语音模型,能解决大型语音语言模型(LSLM)领域长期存在...
阅读原文

混元3D 3.0

混元3D 3.0是腾讯最新发布的先进的3D生成模型。采用了首创的3D-DiT分级雕刻技术,能生成超高清的3D几何结构,建模精度提升3倍,几何分辨率高达1536³,支持36...
阅读原文

Lumina-DiMOO

Lumina-DiMOO是上海人工智能实验室等机构开源的新一代多模态生成与理解模型。模型采用全离散扩散架构,统一处理文本、图像等多模态数据,支持文本到图像生成...
阅读原文
156789272