标签：长文本理解

WPS接入DeepSeek，秒变办公神器！

WPS 大家经常用来日常写作，虽然本身提供了AI功能，但可惜需要会员，本文教你三分钟接入最火的DeepSeek，让WPS秒变办公神器。 DeepSeek API申请地址：http:/...

阅读原文

AI教程

1年前 (2025)

AI赚钱副业~AI生成影视解说，半个月涨粉变现3.5W+！

这两年大家都在感叹生活不易，然而我想说的是，机会还是有的，但问题不在于有没有，而在于你是否能够认准机会，然后抓住它。接触过很多咨询项目的人，发现...

使用教程

2年前 (2024)

Qwen-VLA

Qwen-VLA 是通义实验室推出的通用视觉-语言-动作模型，以 Qwen3.5-4B 为视觉语言主干，搭配 1.15B 参数的 DiT 动作解码器。模型通过统一动作轨迹预测框架，将...

阅读原文

AI工具

2天前

Youtu-LLM

Youtu-LLM 是腾讯 Youtu 团队开源的轻量级语言模型，参数规模为 19.6 亿。专为智能体任务设计，具备强大的“原生智能体能力”，在多项任务中超越同规模甚至更大...

阅读原文

AI工具

5个月前

openPangu-VL-7B

openPangu-VL-7B 是华为推出的开源多模态模型，专为昇腾硬件优化。模型结合语言和视觉能力，具备强大的视觉定位和OCR功能，能高效处理图像、文档和视频任务。

阅读原文

AI工具

5个月前

QwenLong-L1.5

QwenLong-L1.5 是阿里通义实验室推出的专注于长文本推理的大语言模型。模型基于 Qwen3-30B-A3B 架构，通过系统化的后训练方案，显著提升长文本推理能力。

阅读原文

AI工具

5个月前

Qwen3-Next

Qwen3-Next是阿里通义开源的新一代混合架构大模型，包含指令版(Qwen3-Next-80B-A3B-Instruct )和思维版(Qwen3-Next-80B-A3B-Thinking)两个版本。

阅读原文

AI工具

9个月前

SlowFast-LLaVA-1.5

SlowFast-LLaVA-1.5（简称SF-LLaVA-1.5）是专为长视频理解设计的高效视频大语言模型。基于双流（SlowFast）机制，平衡处理更多输入帧与减少每帧令牌数量之间...

阅读原文

AI工具

9个月前

RWKV-7-2.9B

RWKV-7-2.9B模型（RWKV-7-World-2.9B-V3）是RWKV 基金推出的先进 RNN 大语言模型。基于 RWKV World V3 数据集训练，具有 29 亿参数，支持世界所有语言。模型...

阅读原文

AI工具

1年前 (2025)

谷歌Titans模型架构：200万Token上下文长度，突破长文本处理瓶颈

原标题：谷歌Titans模型架构：200万Token上下文长度，突破长文本处理瓶颈文章来源：小夏聊AIGC 内容字数：811字谷歌Titans：突破百万级上下文长度的仿生AI模...

阅读原文

使用教程

1年前 (2025)

腾讯联合智源发布升级版长文本理解基准测试模型—LongBench v2

原标题：腾讯联合智源发布升级版长文本理解基准测试模型—LongBench v2 文章来源：小夏聊AIGC 内容字数：1502字LongBench v2：衡量大型语言模型长文本理解能力...

阅读原文

使用教程

1年前 (2024)

全面超越CoT！Meta田渊栋团队新作：连续思维链

原标题：全面超越CoT！Meta田渊栋团队新作：连续思维链文章来源：新智元内容字数：5433字Meta田渊栋团队提出新型LLM推理范式：连续思维链(Coconut) Meta田...

阅读原文

AIGC动态

1年前 (2024)