语音合成 - 第 2 页

Stable Audio Open Small

Stable Audio Open Small 是 Stability AI 与 Arm 合作推出的轻量级文本到音频生成模型。基于 Stable Audio Open 模型，参数量从11亿减少到3.41亿，生成速度...

阅读原文

AI工具

11个月前

Audio-SDS

Audio-SDS是NVIDIA AI研究团队推出的创新技术，将Score Distillation Sampling（SDS）技术扩展至文本条件音频扩散模型，为音频处理领域带来了重大突破。无需...

阅读原文

AI工具

12个月前

MegaTTS 3

MegaTTS 3是字节跳动与浙江大学合作推出的零样本文本到语音合成系统，采用轻量级扩散模型，参数量仅0.45B，能高效生成高质量语音。系统将语音分解为内容、音...

阅读原文

AI工具

1年前 (2025)

PaddleSpeech

PaddleSpeech 是百度飞桨团队开源的语音处理工具，提供全面的语音处理功能，包括语音识别、语音合成、声纹识别、语音翻译等。PaddleSpeech提供命令行界面、服...

阅读原文

AI工具

1年前 (2025)

TicVoice 7.0

TicVoice 7.0 是出门问问推出的第七代高品质 TTS（语音合成）引擎，基于新一代语音生成模型 Spark-TTS 。TicVoice 7.0基于创新的 BiCodec 编码方式，将语音分...

阅读原文

AI工具

1年前 (2025)

Baichuan-Audio

Baichuan-Audio是百川智能推出的端到端音频大语言模型，支持无缝集成音频理解和生成功能，实现支持高质量、可控的实时中英双语对话。Baichuan-Audio基于多码...

阅读原文

AI工具

1年前 (2025)

IndexTTS

IndexTTS 是 B 站推出的工业级可控文本转语音（TTS）系统。基于 XTTS 和 Tortoise 模型开发，结合了 GPT 风格的生成技术，能将文本高效转化为自然流畅的语音...

阅读原文

AI工具

1年前 (2025)

PySpur

PySpur 是开源的轻量级可视化 AI 智能体工作流构建器，简化 AI 系统的开发流程。基于拖拽式界面让用户能快速构建、测试和迭代 AI 工作流，无需编写复杂代码。...

阅读原文

AI工具

1年前 (2025)

AI说书媲美真人！豆包语音大模型升级长上下文理解

打破传统语音合成链路，端到端生成

阅读原文

AIGC动态

1年前 (2025)

Llasa TTS

Llasa TTS 是香港科技大学基于 LLaMA 架构推出的开源文本转语音（TTS）模型，支持高质量语音合成和克隆。Llasa TTS 基于单层向量量化（VQ）编解码器和单个 Tr...

阅读原文

AI工具

1年前 (2025)

Step-Audio-TTS-3B

Step-Audio-TTS-3B 是 Stepfun-AI 团队推出的高性能文本到语音（TTS）模型，具有强大的语音合成能力。基于海量合成数据训练，参数量达到30亿，能生成自然流畅...

阅读原文

AI工具

1年前 (2025)

TurboTTS

TurboTTS 是免费的在线文本转语音工具，支持70多种语言和300多种真实语音选择，能生成自然、逼真的语音效果，适用于短视频创作、在线教育、广告制作、播客等...

阅读原文

AI工具

1年前 (2025)

播记

播记是专为播客创作者设计的智能节目笔记（Shownotes）生成工具。通过AI技术，能快速提取播客音频中的关键信息，自动生成包含节目主题、嘉宾介绍、重要观点、...

阅读原文

AI工具

1年前 (2025)

Kokoro-TTS

Kokoro-TTS 是 hexgrad 开发的轻量级文本转语音（TTS）模型，具有 8200 万参数。基于 StyleTTS 2 和 ISTFTNet 的混合架构，采用纯解码器设计，不使用扩散模型...

阅读原文

AI工具

1年前 (2025)

什么是TTS（Text To Speech）

TTS（Text to Speech）即文本转语音技术。是一种将文本信息转化为自然语音输出的技术。通过TTS技术，计算机可以将输入的文本自动转换成自然语音，模拟出人类...

阅读原文

AI百科

1年前 (2024)

标签：语音合成