标签:AI内容生成

GLM-4.6V

GLM-4.6V 是智谱推出的多模态大模型,包含面向云端与高性能集群场景的基础版GLM-4.6V(106B-A12B)和面向本地部署与低延迟应用的轻量版GLM-4.6V-Flash(9B)。
阅读原文

FLUX.2

FLUX.2 是 Black Forest Labs 推出的视觉智能模型,专为实际创意工作流程设计。模型支持最多 10 张图片的多图参考,生成高达 4MP 分辨率的高质量图像,具备极...
阅读原文

Brix

Brix 是AI原生全球招聘与组织管理平台,专注于通过 AI 技术革新传统招聘流程。平台拥有超过 9.6 亿的全球人才库,覆盖 200 多个国家,能实现从人才搜索、自动...
阅读原文

WorldGen

WorldGen 是 Meta 最新推出的先进端到端系统,能通过一段文本提示生成可交互、可导航的 3D 世界。用户只需输入简单的描述,如“中世纪村庄”或“火星基地”,系统...
阅读原文

Elser.AI

Elser.AI 是AI动漫创作的平台,通过先进的技术将用户的简单创意转化为高质量的动漫内容,涵盖漫画、视频和短剧等多种形式。用户只需提供故事梗概或创意,Else...
阅读原文

Gemini 3

Gemini 3 是谷歌最新推出的AI模型,被誉为全球最先进的多模态理解与推理模型。模型具备强大的推理能力,刷新多项基准测试记录,如在 LMArena Leaderboard 上...
阅读原文

DPAI Arena

DPAI Arena 是 JetBrains 与 Linux 基金会合作推出的开放式 AI 编码智能体基准测试平台,能衡量 AI 工具在多语言、多框架和多工作流中的实际开发效率,基于多...
阅读原文

Bee

Bee是清华大学和腾讯混元团队联合推出的高质量多模态大语言模型(MLLM)项目,解决开源模型因数据质量不足导致的性能瓶颈。项目的核心贡献包括:Honey-Data-1...
阅读原文

LongCat-Flash-Omni

LongCat-Flash-Omni 是美团 LongCat 团队开源的全模态大语言模型,基于 LongCat-Flash 系列高效架构设计,创新性地集成多模态感知和语音重建模块,拥有 5600 ...
阅读原文

GigaBrain-0

GigaBrain-0 是新型的视觉-语言-行动(VLA)基础模型,由世界模型生成的数据驱动。模型通过大规模生成多样化数据,减少了对真实机器人数据的依赖,显著提升了...
阅读原文

Rube

Rube是基于Model Context Protocol(MCP)服务器的统一AI平台,可将AI工具连接到600多款应用(如Gmail、Slack、GitHub与Notion)。用户只需在AI客户端安装一...
阅读原文

Hakko AI

Hakko AI是心影随形推出的AI陪伴产品,是逗逗游戏伙伴的海外版。专注于游戏场景,通过多模态感知技术,能实时理解游戏画面并提供陪伴和帮助。Hakko AI支持多...
阅读原文

UniPixel

UniPixel是香港理工大学和腾讯ARC Lab团队开发的首个统一像素级多模态大模型,专注于图像/视频的精细理解与交互。能在单个模型中完成对象指代、像素级分割和...
阅读原文

LLaVA-OneVision-1.5

LLaVA-OneVision-1.5 是开源的多模态模型,通过高效训练和高质量数据实现高性能、低成本和强复现性。采用自研的 RICE-ViT 作为视觉编码器,结合 2D 旋转位置...
阅读原文

TextWell

TextWell是AI写作辅助工具,能提升文档质量与吸引力,通过模拟AI评审团,从不同角度对文档进行批评和建议,帮助用户优化内容。
阅读原文
123