统一SAM2和LLaVA!字节豆包提出Dense Video多模态大模型Sa2VA

第一个结合SAM-2和LLaVA-like的视频多模态大模型。
阅读原文

如何训练最强代码大模型?北大aiXcoder-7B贡献前沿实践

该论文已被软件工程领域国际顶级会议 ICSE 2025 收录。
阅读原文

Zyler AI

Zyler AI 是专注于营销分析的人工智能平台,帮助企业和专业人士快速生成高质量的分析报告。通过一键集成 Google Analytics、Meta Ads 等主流数据源,基于强大...
阅读原文

HumanDiT

HumanDiT 是浙江大学和字节跳动联合提出的姿态引导的高保真人体视频生成框架。基于扩散变换器(Diffusion Transformer,DiT),能在大规模数据集上训练,生成...
阅读原文

Symbolab

Symbolab是 EqsQuest Ltd.推出的AI驱动的数学解题工具,通过提供详细的分步解决方案,帮助用户解决从基础算术到高等数学的各类问题,涵盖代数、微积分、三角...
阅读原文

超强视频模型Ray2宣布增加支持图生视频

原标题:超强视频模型Ray2宣布增加支持图生视频 文章来源:科技未来派 内容字数:46字Luma AI Ray2升级:图生视频功能上线,AI视频创作更上一层楼! 大家好...
阅读原文

曝国行苹果 AI 与阿里合作,或 4 月到来/特斯拉将推出 7 座焕新版 Model Y/华为、上汽合作敲定,共同打造「尚界」

· 宁德时代或将打造工业机器人\x0d\x0a· 机构:华为登顶 2024 中国平板电脑市场第一\x0d\x0a· 三星 Galaxy S25 系列国行版正式发布
阅读原文

清华大学第二弹:DeepSeek 赋能职场应用【详细教程免费领】

原标题:清华大学第二弹:DeepSeek 赋能职场应用【详细教程免费领】 文章来源:AI范儿 内容字数:3089字DeepSeek赋能职场:你的AI赛博外挂 本文总结了“DeepS...
阅读原文

苹果 × 阿里,iPhone AI 版要来了?

苹果终于坐不住了!\x0a\x0a面对 华为、小米、vivo AI 旗舰机的狂飙,库克承认:iPhone 缺 AI,是销量下滑的核心原因。\x0a\x0a根据 The Information 爆料,...
阅读原文

TPO

TPO(Test-Time Preference Optimization)是新型的AI优化框架,在推理阶段对语言模型输出进行动态优化,更符合人类偏好。TPO通过将奖励信号转化为文本反馈,...
阅读原文

PDF to Podcast

PDF to Podcast是NVIDIA推出的PDF转音频的AI工具,基于NVIDIA NIM微服务架构的,能将PDF文档转换为生动的音频内容,如播客。基于大型语言模型(LLM)、文本到...
阅读原文

InternVideo2.5

InternVideo2.5是上海人工智能实验室联合南京大学、中科院深圳先进技术研究院共同开源的视频多模态大模型。在视频理解领域取得了显著进展,特别是在长视频处...
阅读原文