VoxInstruct

VoxInstruct 是由清华大学开源的语音合成技术,能根据人类语言指令生成高度符合用户需求的语音。系统采用统一的多语言编解码器语言建模框架,将传统的文本到...
阅读原文

Spotter Studio

Spotter Studio 是专为 YouTube 创作者设计的AI创意工具,旨在简化视频构思、研究和规划过程。通过个性化的头脑风暴、数据驱动的研究和全面的项目管理工具,...
阅读原文

Dinox

Dinox是基于AI技术的语音笔记应用,通过实时语音转录功能,帮助用户快速记录灵感和信息。Dinox的特点包括本地优先存储、多平台同步、智能生成笔记标题和分类...
阅读原文

Kuakua

Kuakua 是结合积极心理学和AI技术的平台,提升用户的幸福感和心理健康。通过提供多语言支持、心理学资源、AI辅助工具、正念练习和生活方式建议,帮助用户在日...
阅读原文

AI Hug

AI Hug 是一种基于人工智能技术将静态照片转换成动态拥抱视频的在线工具。通过先进的AI算法,包括深度学习、自然语言处理和计算机视觉技术,分析图像中的人物...
阅读原文

AI Baby Generator

AI Baby Generator 是基于AI技术来预测和生成未来孩子可能的外貌的工具。通过分析父母的照片,基于先进的算法预测并生成他们未来孩子的可能外貌。
阅读原文

Pixtral 12B

Pixtral 12B 是法国AI初创公司Mistral推出的首款多模态AI模型,能同时处理图像和文本。模型拥有 120 亿参数,模型大小约为 24GB,基于文本模型 Nemo 12B构建...
阅读原文

MMRole

MMRole是由中国人民大学高瓴人工智能学院研究团队推出的的一种多模态角色扮演智能体(MRPA)框架。通过结合图像和文本,使智能体以特定角色进行更自然和沉浸...
阅读原文

Readtheirlips

Readtheirlips 是由 Symphonic Labs 推出的一款AI软件,用于通过分析视频中人物的嘴唇运动来识别和转录口语内容。软件能解读在没有声音的情况下,或者在声音...
阅读原文

TikTok Voice

TikTok Voice 是基于AI技术的文字转语音(TTS)在线工具,将文本转换成各种流行于TikTok平台的声音效果。工具为用户提供多种语音选项,如女士声音、Siri声音...
阅读原文

风平智能

风平智能是领先的AI生成内容(AIGC)解决方案提供商,专注于虚拟数字人技术的创新与应用。核心产品“风平IP智造平台”,提供一站式服务,包括虚拟数字人定制、A...
阅读原文

ReHiFace-S

RReHiFace-S是由硅基智能团队推出的开源项目,实现高保真、实时人脸替换的AI算法,用户通过简单的操作在视频或直播中进行面部交换。
阅读原文

NarratoAI

NarratoAI 是基于AI技术自动化影视解说和编辑的工具。通过大型语言模型(LLM)理解视频内容,自动生成解说文案,并将文案转化为配音,同时进行视频剪辑和字幕...
阅读原文

OpenAI o1模型

OpenAI o1模型是OpenAI公司最新发布的最强推理系列AI大模型,即“Strawberry”草莓大模型,包括一款 OpenAI o1-preview 的推理模型,还有一个更小、成本更低的...
阅读原文

Skywork-Reward

Skywork-Reward 是昆仑万维推出的一系列高性能奖励模型,包括 Skywork-Reward-Gemma-2-27B 和 Skywork-Reward-Llama-3.1-8B。主要用于指导和优化大语言模型的...
阅读原文