标签:多模态大模型

WPS接入DeepSeek,秒变办公神器!

WPS 大家经常用来日常写作,虽然本身提供了AI功能,但可惜需要会员,本文教你三分钟接入最火的DeepSeek,让WPS秒变办公神器。 DeepSeek API申请地址:http:/...
阅读原文

AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!

这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...

Qianfan-VL

Qianfan-VL是百度智能云千帆推出的面向企业级多模态应用场景的视觉理解大模型。模型包含3B、8B和70B三种尺寸版本,具备出色的通用能力和针对OCR、教育等垂直...
阅读原文

InternVLA-A1

InternVLA-A1 是上海人工智能实验室和国家地方共建人形机器人创新中心联合发布的具身操作大模型。具备理解、想象、执行一体化的能力,能精准地完成任务。模型...
阅读原文

大语言模型简史:从Transformer(2017)到DeepSeek-R1(2025)的进化之路

原标题:大语言模型简史:从Transformer(2017)到DeepSeek-R1(2025)的进化之路 文章来源:人工智能学家 内容字数:24587字大型语言模型(LLM)发展简史:...
阅读原文

统一SAM2和LLaVA!字节豆包提出Dense Video多模态大模型Sa2VA

第一个结合SAM-2和LLaVA-like的视频多模态大模型。
阅读原文

反超 DeepSeek-V3,新发布的 Qwen2.5-Max 到底有多牛?

登上大模型盲测榜单全球前十,数学及编程能力夺冠。
阅读原文

年末重磅!ByteDance Research视频理解大模型「眼镜猴」正式发布

补齐多模态最后一块短板,Tarsier2 反超 GPT4o、Gemini-1.5-Pro!
阅读原文

阶跃星辰再拿多模态榜首,全方位升级发布六款模型

由月更加速到日更,阶跃模型迭代驶入「快车道」。
阅读原文

前微软亚研院视觉专家胡瀚加入腾讯,负责混元多模态大模型

胡瀚是计算机视觉领域通用架构Swim Transformer的核心作者之一。
阅读原文

谢赛宁、李飞飞「空间智能」新作:多模态大模型仍难突破空间推理

原标题:谢赛宁、李飞飞「空间智能」新作:多模态大模型仍难突破空间推理 文章来源:人工智能学家 内容字数:8364字多模态大语言模型的空间推理能力研究 本...
阅读原文

决策背后的秘密:探索首个多模态大模型的魔法与科学之谜

首个深入探索多模态大模型(MLLM)的可解释性综述,从数据、模型、训练推理多个视角剖析多模态人工智能的决策逻辑,揭示其 “魔法” 背后的科学依据。
阅读原文
12