标签:长文本理解
WPS接入DeepSeek,秒变办公神器!
WPS 大家经常用来日常写作,虽然本身提供了AI功能,但可惜需要会员,本文教你三分钟接入最火的DeepSeek,让WPS秒变办公神器。 DeepSeek API申请地址:http:/...
AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!
这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...
openPangu-VL-7B
openPangu-VL-7B 是华为推出的开源多模态模型,专为昇腾硬件优化。模型结合语言和视觉能力,具备强大的视觉定位和OCR功能,能高效处理图像、文档和视频任务。
QwenLong-L1.5
QwenLong-L1.5 是阿里通义实验室推出的专注于长文本推理的大语言模型。模型基于 Qwen3-30B-A3B 架构,通过系统化的后训练方案,显著提升长文本推理能力。
Qwen3-Next
Qwen3-Next是阿里通义开源的新一代混合架构大模型,包含指令版(Qwen3-Next-80B-A3B-Instruct )和思维版(Qwen3-Next-80B-A3B-Thinking)两个版本。
SlowFast-LLaVA-1.5
SlowFast-LLaVA-1.5(简称SF-LLaVA-1.5)是专为长视频理解设计的高效视频大语言模型。基于双流(SlowFast)机制,平衡处理更多输入帧与减少每帧令牌数量之间...
RWKV-7-2.9B
RWKV-7-2.9B模型(RWKV-7-World-2.9B-V3) 是RWKV 基金推出的先进 RNN 大语言模型。基于 RWKV World V3 数据集训练,具有 29 亿参数,支持世界所有语言。模型...
谷歌Titans模型架构:200万Token上下文长度,突破长文本处理瓶颈
原标题:谷歌Titans模型架构:200万Token上下文长度,突破长文本处理瓶颈 文章来源:小夏聊AIGC 内容字数:811字谷歌Titans:突破百万级上下文长度的仿生AI模...
腾讯联合智源发布升级版长文本理解基准测试模型—LongBench v2
原标题:腾讯联合智源发布升级版长文本理解基准测试模型—LongBench v2 文章来源:小夏聊AIGC 内容字数:1502字LongBench v2:衡量大型语言模型长文本理解能力...
全面超越CoT!Meta田渊栋团队新作:连续思维链
原标题:全面超越CoT!Meta田渊栋团队新作:连续思维链 文章来源:新智元 内容字数:5433字Meta田渊栋团队提出新型LLM推理范式:连续思维链(Coconut) Meta田...
粤公网安备 44011502001135号