Transcript LOL
Transcript LOL 是面向专业人士的 AI 音视频转录工具,已服务全球 10 万+用户。基于 OpenAI Whisper 技术,可在数秒内将音频或视频高精度转为文字,支持 70+ ...
pplx-embed
pplx-embed 是 Perplexity 推出的系列文本嵌入模型,包含标准检索的 pplx-embed-v1 和上下文感知的 pplx-embed-context-v1,均提供 0.6B 和 4B 两种规模。
SkyReels V4
SkyReels V4是昆仑万维推出的视频基础模型,是全球首个支持多模态输入、联合音视频生成及统一生成/修复/编辑的AI视频模型。模型采用双流MMDiT架构,可生成108...
LocoOperator-4B
LocoOperator-4B 是 LocoreMind 开源的 4B 参数代码探索智能体,基于 Qwen3-4B-Instruct 通过知识蒸馏从 Qwen3-Coder-Next 训练而来。模型定位为 Claude Code...
Ctrl-World
Ctrl-World 是清华陈建宇与斯坦福 Chelsea Finn 团队联合推出的具身世界模型,在 WorldArena 权威评测中斩获具身任务能力全球第一、视频生成质量全球第二。
Perplexity Computer
Perplexity Computer 是 Perplexity 推出的基于浏览器的、全能型通用数字员工,能自主拆解复杂任务,调度19个顶尖AI模型并行协作,如Claude负责推理、Gemini...
粤公网安备 44011502001135号