AI工具

IndexTTS

IndexTTS 是 B 站推出的工业级可控文本转语音(TTS)系统。基于 XTTS 和 Tortoise 模型开发,结合了 GPT 风格的生成技术,能将文本高效转化为自然流畅的语音...
阅读原文

All Voice Lab

All Voice Lab(趣丸千音)是全球领先的AI语音创作平台,提供一站式智能语音解决方案,基于趣丸科技与香港中文大学(深圳)联合研发的MaskGCT语音大模型开发...
阅读原文

a0.dev

a0.dev 是基于 AI 技术的开发平台,专注于快速生成 React Native 应用。a0.dev 基于自然语言输入,自动生成完整的 React Native 项目代码,包括前端界面、状...
阅读原文

VideoGrain

VideoGrain 是悉尼科技大学和浙江大学推出的零样本多粒度视频编辑框架,能实现类别级、实例级和部件级的精细视频修改。VideoGrain基于调节时空交叉注意力和自...
阅读原文

Dreamona

Dreamona 是 AI 视频生成工具,用户基于简单的文字描述或上传图片,快速生成高质量的动态视频。Dreamona 支持多种视频风格,从现实主义到创意动画,满足不同...
阅读原文

Zapier Agents

Zapier Agents 是 Zapier 推出的 AI 自动化工具,通过人工智能技术帮助用户高效处理各种任务。能与 Zapier 支持的 7000 多个应用程序无缝集成,例如 Salesfor...
阅读原文

腾讯混元Turbo S

腾讯混元Turbo S是腾讯推出的新一代快思考模型。模型采用创新的Hybrid-Mamba-Transformer融合架构,有效降低了传统Transformer的计算复杂度,减少了KV-Cache...
阅读原文

救救图片

救救图片是基于AI技术的在线图片处理工具,能快速去除图片水印、修复模糊、无损放大、去除马赛克,支持一键抠图和生成相似图片等功能。基于先进的AI算法,可...
阅读原文

olmOCR

olmOCR 是 Ai2 推出的开源工具,用在将 PDF 文档高效转换为干净的结构化纯文本。olmOCR结合文档锚定(document-anchoring)技术与Qwen2-VL-7B-Instruct(阿里...
阅读原文

DualPipe

DualPipe 是DeepSeek开源的创新的双向流水线并行技术,主要用于提升大规模深度学习模型的训练效率。核心思想是将模型的训练过程分为两个独立的管道——前向计算...
阅读原文

EPLB

EPLB(Expert Parallelism Load Balancer)是 DeepSeek 推出的专家并行负载均衡器,能解决大规模模型训练中不同专家模型(Expert)负载不均的问题。EPLB 基于...
阅读原文

OctoTools

OctoTools 是斯坦福大学推出的开源智能体框架,基于可扩展的工具解决复杂的推理任务。OctoTools用标准化的工具卡片(tool cards)封装工具功能,无需额外训练...
阅读原文

SynClub

SynClub 是百度推出的海外 AI 社交应用,基于先进的AI技术为用户提供与虚拟 AI 朋友互动的社交体验。用户能创建、定制专属的 AI 角色,AI角色能学习用户的习...
阅读原文

rtrvr.ai

rtrvr.ai 是 AI 浏览器扩展工具,通过自然语言指令简化网页浏览和任务自动化。用户可以通过简单的语音或文字命令,让 rtrvr.ai 完成网页导航、数据提取、表单...
阅读原文

Landing

Landing是AI落地页生成工具,通过 AI 技术,能在几分钟内快速生成美观且高效的落地页。用户只需输入品牌信息和关键词,Landing会自动提取品牌风格,生成匹配...
阅读原文