Transcript LOL

Transcript LOL 是面向专业人士的 AI 音视频转录工具,已服务全球 10 万+用户。基于 OpenAI Whisper 技术,可在数秒内将音频或视频高精度转为文字,支持 70+ ...
阅读原文

AngelSlim

AngelSlim 是腾讯混元团队自研并开源的全模态大模型压缩工具包,通过量化、投机采样、稀疏化和蒸馏等技术,为大语言模型(LLM)、视觉语言模型(VLM)及语音...
阅读原文

水产市场

水产市场(Seafood Market)是为 OpenClaw 构建的 AI Agent 生态平台。平台汇聚了 700+ 技能资产,涵盖 SEO 优化、PPT 生成、周报撰写、多源新闻聚合等实用能...
阅读原文

万镜一刻

万镜一刻是阿里云推出的AI视频创作工具,以"万镜生辉·一刻成片"为核心理念,为不同需求的创作者提供从内容解析到故事板生成的一站式解决方案。产品...
阅读原文

Arrow 1.0

Arrow 1.0 是 Quiver AI 推出全球首款 SVG 原生 AI 生成模型。与传统像素生成模型不同,模型能直接输出可缩放矢量图形代码,图像基于数学公式构建,支持无限...
阅读原文

pplx-embed

pplx-embed 是 Perplexity 推出的系列文本嵌入模型,包含标准检索的 pplx-embed-v1 和上下文感知的 pplx-embed-context-v1,均提供 0.6B 和 4B 两种规模。
阅读原文

SkyReels V4

SkyReels V4是昆仑万维推出的视频基础模型,是全球首个支持多模态输入、联合音视频生成及统一生成/修复/编辑的AI视频模型。模型采用双流MMDiT架构,可生成108...
阅读原文

LocoOperator-4B

LocoOperator-4B 是 LocoreMind 开源的 4B 参数代码探索智能体,基于 Qwen3-4B-Instruct 通过知识蒸馏从 Qwen3-Coder-Next 训练而来。模型定位为 Claude Code...
阅读原文

MoodMax

MoodMax 是一站式AI漫剧创作平台,是为创作者和工作室打造工业级漫剧生产工作台。用户无需绘画基础,通过智能剧本创作、自动分镜拆解、短片合成三步即可完成...
阅读原文

Ctrl-World

Ctrl-World 是清华陈建宇与斯坦福 Chelsea Finn 团队联合推出的具身世界模型,在 WorldArena 权威评测中斩获具身任务能力全球第一、视频生成质量全球第二。
阅读原文

Talksign-1

Talksign-1是专为美式手语(ASL)设计的AI实时翻译模型,支持双向转换,能通过摄像头捕捉3D人体关键点识别250个ASL词汇,或将语音/文字转为手语视频。
阅读原文

KiloClaw

KiloClaw 是Kilo code推出的OpenClaw的全托管云服务。OpenClaw 支持 50 余种聊天平台、执行系统命令、操控浏览器,自行部署需 30-60 分钟配置且维护繁琐。
阅读原文

Perplexity Computer

Perplexity Computer 是 Perplexity 推出的基于浏览器的、全能型通用数字员工,能自主拆解复杂任务,调度19个顶尖AI模型并行协作,如Claude负责推理、Gemini...
阅读原文

MaxClaw

MaxClaw是MiniMax Agent平台推出的OpenClaw一键云端部署方案,用户无需配置服务器,10秒内可完成部署,零技术门槛、零维护负担。
阅读原文

牛马AI

牛马AI是本地化AI个人生产力客户端,主打"让AI当牛做马"的人机协同理念。工具支持完全离线运行,可自由接入OpenRouter、Kimi、DeepSeek等多种API及...
阅读原文
123312