标签:自然语言处理

Eleven v3

Eleven v3是ElevenLabs推出的先进文本转语音模型。通过内联音频标签实现情感和语调的精确控制,支持多说话人对话,对话更自然。模型支持超70种语言,文本理解...
阅读原文

PandaWiki

PandaWiki 是开源的AI知识库搭建系统,基于 AI 大模型的能力,帮助用户快速构建智能化的产品文档、技术文档、FAQ 和博客系统。核心功能包括 AI 辅助创作、AI ...
阅读原文

Mary Meeker团队推出《人工智能趋势报告》(PDF文件)

Mary Meeker团队推出的《人工智能发展趋势》报告,全面分析AI技术的爆炸式发展及全球影响。报告指出,AI的用户增长(如ChatGPT在17个月内达到8亿用户)和资本...
阅读原文

Mobvoi MCP Server

Mobvoi MCP Server 是出门问问推出的一站式集成各项 AI 能力的工具,Mobvoi MCP Server集成语音生成、声音克隆、图片驱动数字人、视频配音等多项多模态 AI 能...
阅读原文

AIpai

AIpai是AI视频创作Agent产品,支持帮助用户快速生成专业视频内容。基于智能编剧、角色设计、场景构建和视频生成等功能,满足从病毒式短剧、热点视频到品牌宣...
阅读原文

DeepSeek-R1-0528

DeepSeek-R1-0528 是 DeepSeek 团队推出的最新版AI模型。模型基于 DeepSeek-V3-0324 训练,参数量达 660B。模型在 HuggingFace 上开源,开发者能自由使用和修...
阅读原文

CoGenAV

CoGenAV - 通义联合深圳技术大学推出的多模态语音表征模型
阅读原文

CAR

CAR(Certainty-based Adaptive Reasoning)是字节跳动联合复旦大学推出的自适应推理框架,能提升大型语言模型(LLM)和多模态大型语言模型(MLLM)在不同任...
阅读原文

LMEval

LMEval 是谷歌推出的开源框架,用在简化大型模型(LLMs)的跨提供商评估。框架支持多模态(文本、图像、代码)和多指标评估,兼容 Google、OpenAI、Anthropic...
阅读原文

LLaDA-V

LLaDA-V是中国人民大学高瓴人工智能学院、蚂蚁集团推出的多模态大语言模型(MLLM),基于纯扩散模型架构,专注于视觉指令微调。模型在LLaDA的基础上,引入视...
阅读原文

Uplyt

Uplyt 是基于AI技术的分析工具,支持简化 Google Analytics 的数据管理和分析流程。工具基于清晰的仪表盘展示关键指标,如自然搜索流量和转化趋势,让用户轻...
阅读原文

Rork

Rork是AI驱动的无代码开发工具,能快速生成跨平台移动应用。用户只需用自然语言描述应用需求,Rork自动生成界面、功能和逻辑,支持iOS和Android平台。
阅读原文

CoreAgent

CoreAgent是网易智企推出的企业级智能体开发协作平台。支持问答、工作流、自主智能体等多种形态的智能体开发、测评和托管。平台采用RAG技术构建知识库,具备...
阅读原文

Aurora

Aurora是微软研究院推出的13亿参数的大气基础模型,基于从海量大气数据中提取有价值信息,用在预测全球天气模式、空气污染和海洋波浪等大气过程。模型用预训...
阅读原文

DeepWiki MCP

DeepWiki MCP 是Cognition Labs推出的远程服务器,基于开放标准的 Model Context Protocol(MCP)。DeepWiki MCP为 AI 应用提供访问和搜索 GitHub 代码库文档...
阅读原文
123467