标签:内容创作

A2UI

A2UI(Agent-to-User Interface)是谷歌开源的基于Agent的接口协议,用于AI与用户界面之间的交互。A2UI通过AI生成的JSON描述,让客户端原生渲染交互界面,无...
阅读原文

通义百聆

通义百聆是阿里通义实验室推出的企业级语音基座大模型,整合 Fun-ASR 语音识别和 Fun-CosyVoice 语音合成两大模型,专为复杂环境下的语音应用设计,通过 Cont...
阅读原文

LLaDA 2.0

LLaDA 2.0 是蚂蚁集团开源的离散扩散大语言模型(dLLM),包含 16B(mini)和 100B(flash)两个版本。打破了扩散模型难以扩展的瓶颈,首次将参数规模扩展至 ...
阅读原文

SCAIL

SCAIL(Studio-grade Character Animation via In-context Learning)是智谱AI推出的面向影视级标准的角色动画生成框架。框架通过创新的3D一致性姿态表征和全...
阅读原文

Pyscn

Pyscn 是专为 Python 开发者设计的智能代码质量分析工具,帮助开发者快速发现并清理代码中的问题,如死代码、重复代码、复杂代码结构等。通过控制流图(CFG)...
阅读原文

OpenLens AI

OpenLens AI 是清华大学自动化系推出的专为医学研究设计的全自主人工智能研究助手,通过多智能体协作,实现从文献综述、实验设计、数据分析到论文生成的全流...
阅读原文

KAT-Coder

KAT-Coder 是快手旗下 Kwaipilot 团队发布的闭源旗舰代码生成模型,具备强大的编程能力。能高效完成功能开发、缺陷分析、单测生成等任务,支持多种编程语言,...
阅读原文

问小白5

问小白5是问小白推出的“All in One”旗舰大模型,是国产大模型中智能水平最高的。模型在多项评测中表现优异,如AA-Index综合评估指标得分64.7分,STEM能力评测...
阅读原文

RynnRCP

RynnRCP 是阿里达摩院开源的机器人上下文协议(Robotics Context Protocol),能打通具身智能开发全流程。RynnRCP 包含 RCP 框架 和 RobotMotion 两大模块,...
阅读原文

gpt-oss

GPT-OSS 是 OpenAI 推出的开源推理模型系列,包含 gpt-oss-120b 和 gpt-oss-20b 两个版本。gpt-oss-120b 拥有1170亿参数,激活参数约51亿,能在单张 80GB GPU...
阅读原文

Producer.ai

Producer.ai 是 AI 音乐创作平台。通过先进的 AI 技术,为用户提供了一个简单易用的音乐创作环境,帮助用户激发创造力并快速生成音乐作品。用户可以通过自然...
阅读原文

MiDashengLM

MiDashengLM是小米开源的高效声音理解大模型,具体参数版本为MiDashengLM-7B 。模型基于 Xiaomi Dasheng 音频编码器和 Qwen2.5-Omni-7B Thinker 解码器构建,...
阅读原文

Skywork MindLink

Skywork MindLink是昆仑万维推出开源的推理大模型。具有自适应推理机制,可根据任务复杂度灵活切换推理模式,简单任务快速生成,复杂任务深度推理,兼顾效率...
阅读原文

abogen

abogen 是强大的文本转语音工具,支持将 ePub、PDF 或文本文件快速转换为高质量音频,能生成同步字幕。abogen 基于 Kokoro-82M 模型,支持多种语言和语音风格...
阅读原文

小星绪

小星绪是京东健康团队推出的AIGC(人工智能生成内容)产品,目前处于测试阶段。是以情绪驱动漫画故事生成的AI工具。用户可以通过语音或文字表达情绪和讲述故...
阅读原文
12348