老黄最新采访出炉!自述61年坚持成就了英伟达,AI点燃全世界

新智元报道编辑:桃子 好困 【新智元导读】过去一年的时间,英伟达市值突破2万亿美元,一举成为21世纪的AI巨头。在老黄的最新采访中,向我们展示了即将到来的...
阅读原文

LLM上下文窗口突破200万!无需架构变化+复杂微调,轻松扩展8倍

新智元报道编辑:LRS 【新智元导读】LongRoPE方法首次将LLM的窗口扩展到了2048k个token,只是简单微调的情况下,就能实现与短上下文窗口相近的性能!大型语言...
阅读原文

「专业智能体指导」让小模型学会数学推理!微调Mistral-7B实现86.81%准确率

新智元报道编辑:LRS 【新智元导读】小模型也能解锁数学能力,无需多模型集成,7B模型在GSM 8 k数据集上性能超越70B!对于小型语言模型(SLM)来说,数学应用...
阅读原文

全面解析RLHF,PPO,DPO,Flash Attention,增量学习等大模型算法

随着大模型的飞速发展,在短短一年间就有了大幅度的技术迭代更新,从LoRA、QLoRA、AdaLoRa、ZeroQuant、Flash Attention、KTO、PPO、DPO、蒸馏技术到模型增量...
阅读原文

今日arXiv最热NLP大模型论文:超越GPT-4,清华发布网页导航智能体AutoWebGLM

夕小瑶科技说 原创作者 | Tscom随着大语言模型(LLMs)的发展,Agent在网络导航等任务中展现出了前所未有的能力。想象一下,一个基于LLM的Agent能够在你享用...
阅读原文

人大系多模态模型迈向AGI:首次实现自主更新,写真视频生成力压Sora

机器之心发布 机器之心编辑部在 4 月 27 日召开的中关村论坛通用人工智能平行论坛上,人大系初创公司智子引擎隆重发布全新的多模态大模型 Awaker 1.0,向 AGI...
阅读原文

首届AI方程式大赛,8圈开了一个小时

机器之心报道 编辑:泽南、亚鹂好消息:大多数 AI 赛车都完赛了。在阿布扎比的 F1 赛道上,8 辆赛车使用相同的轮胎,相同的发动机,完全一样的车身,唯一不同...
阅读原文

Sora爆红视频幕后:被骗了,用了成吨的后期才有这效果

机器之心报道 机器之心编辑部「不怕 AI 消灭人类,就怕用 AI 的人太聪明。」今年 2 月份,OpenAI 发布了人工智能文生视频大模型 Sora,并放出了第一批视频片...
阅读原文

亚马逊研究奖获奖名单出炉:谢赛宁、Mamba作者Albert Gu等入选

机器之心报道 机器之心编辑部与去年的 79 位获奖者相比,2023 年「亚马逊研究奖」获得者的人数有了一定的增加,达到了 98 位。近日,亚马逊研究奖(Amazon Re...
阅读原文

CVPR 2024 | 文本一键转3D数字人骨骼动画,阿尔伯塔大学提出MoMask框架

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

超级智能体生命力觉醒!可自我更新的AI来了,妈妈再也不用担心数据瓶颈难题

衡宇 发自 凹非寺量子位 | 公众号 QbitAI哭死啊,全球狂炼大模型,一互联网的数据不够用,根本不够用。 训练模型搞得跟《饥饿游戏》似的,全球AI研究者,都在...
阅读原文

Sora大片:人工特效参与,被指误导大众

鱼羊 发自 凹非寺量子位 | 公众号 QbitAI啊?Sora火爆短片《气球人》,也“造假”了??? 背后艺术家团队的最新揭秘,可谓一石激起千层浪: 原来,视频画面并...
阅读原文

苹果首个AI平板曝光:新iPad Pro直接上M4芯片

金磊 发自 凹非寺量子位 | 公众号 QbitAI苹果第一款真正的AI设备,即将问世。 据彭博社Mark Gurman最新爆料: 苹果将在5月份发布新版iPad Pro,直接搭载M4芯...
阅读原文

单卡跑Llama 70B快过双卡,微软硬生生把FP6搞到了A100里 | 开源

克雷西 发自 凹非寺量子位 | 公众号 QbitAIFP8和更低的浮点数量化精度,不再是H100的“专利”了! 老黄想让大家用INT8/INT4,微软DeepSpeed团队在没有英伟达官...
阅读原文

字节提出视觉基础模型ViTamin,多项任务实现SOTA,入选CVPR2024

文章转载自公众号:量子位,本文只做学术/技术分享,如有侵权,联系删文。 视觉语言模型屡屡出现新突破,但ViT仍是图像编码器的首选网络结构。 字节提出新基...
阅读原文