AI项目和框架 - 第 30 页

SlowFast-LLaVA-1.5

SlowFast-LLaVA-1.5（简称SF-LLaVA-1.5）是专为长视频理解设计的高效视频大语言模型。基于双流（SlowFast）机制，平衡处理更多输入帧与减少每帧令牌数量之间...

阅读原文

AI工具

5个月前

ComoRAG

ComoRAG 是华南理工大学未来技术学院、微信 AI 团队等机构联合推出的认知启发式检索增强生成（RAG）框架，专门用在长篇叙事文本的理解和推理。

阅读原文

AI工具

5个月前

Grok 2.5

Grok 2.5 是埃隆·马斯克旗下 xAI 公司开源的人工智能模型。模型文件可在 Hugging Face 下载，包含 42 个文件，总大小约 500GB，需 8 张显存超 40GB 的 GPU 才...

阅读原文

AI工具

5个月前

Fun-ASR

Fun-ASR 是钉钉与通义实验室语音团队联合推出的新一代语音识别大模型。经过海量音频数据训练，能精准识别互联网、科技、家装、畜牧等十多个行业的专业术语，...

阅读原文

AI工具

5个月前

Intern-S1-mini

Intern-S1-mini是上海人工智能实验室推出的轻量级开源多模态推理模型。基于与 Intern-S1 相同的技术构建。模型融合 8B 密集语言模型（Qwen3）和 0.3B 视觉编...

阅读原文

AI工具

5个月前

Seed-OSS

Seed-OSS 是字节跳动 Seed 团队开源的系列大型语言模型，专注于长文本处理、推理和智能代理能力。模型包含多个版本，如 Seed-OSS-36B-Base 和 Seed-OSS-36B-I...

阅读原文

AI工具

5个月前

AutoCodeBench

AutoCodeBench 是腾讯混元推出的专门测评大模型代码能力基准测试集，包含 3920 个问题，均匀分布在 20 种编程语言中。数据集具有高难度、实用性和多样性，能...

阅读原文

AI工具

5个月前

NVIDIA Nemotron Nano 2

NVIDIA Nemotron Nano 2 是英伟达推出的高效推理模型，参数量为9B。模型基于混合Mamba-Transformer架构，在20万亿个token上预训练，支持128k上下文长度。

阅读原文

AI工具

5个月前

CombatVLA

CombatVLA 是淘天集团未来生活实验室团队推出的专为3D动作角色扮演游戏（ARPG）中的战斗任务设计的高效视觉-语言-动作（VLA）模型。模型基于3B参数规模，通过...

阅读原文

AI工具

5个月前

Klear-Reasoner

Klear-Reasoner 是快手推出的基于 Qwen3-8B-Base 的推理模型，专注于提升数学和代码推理能力。模型通过长思维链监督微调（long CoT SFT）和强化学习（RL）训...

阅读原文

AI工具

5个月前

Nano Banana

Nano Banana 是 AI 图像编辑模型，目前仅在 LMArena 网站上随机出现。模型因极高的人物一致性著称，能精准还原人物的面部特征和表情，同时在背景替换和风格转...

阅读原文

AI工具

5个月前

Matrix-Game 2.0

Matrix-Game 2.0 是昆仑万维 SkyWork AI 发布的自研世界模型。是业内首个开源的通用场景实时长序列交互式生成模型，全面开源，推动交互式世界模型领域的发展...

阅读原文

AI工具

5个月前

RynnVLA-001

RynnVLA-001 是阿里达摩院推出的视觉-语言-动作模型。模型通过在大量第一人称视角的视频上进行预训练，学习人类操作技能，并隐式迁移到机器人手臂的操控中。

阅读原文

AI工具

5个月前

RynnRCP

RynnRCP 是阿里达摩院开源的机器人上下文协议（Robotics Context Protocol），能打通具身智能开发全流程。RynnRCP 包含 RCP 框架和 RobotMotion 两大模块，...

阅读原文

AI工具

5个月前

RynnEC

RynnEC是阿里巴巴达摩院推出的世界理解模型（MLLM），专门用在具身认知任务。模型能从位置、功能、数量等11个维度全面解析场景中的物体，支持物体理解、空间...

阅读原文

AI工具

5个月前