标签:模型
微软清华改进Transformer:用降噪耳机原理升级注意力,一作在线答疑
梦晨 发自 凹非寺量子位 | 公众号 QbitAITransformer自问世后就大放异彩,但有个小毛病一直没解决: 总爱把注意力放在不相关的内容上,也就是信噪比低。 现在...
谷歌超四分之一代码由 AI 生成,CEO:我们的收入甚至超过了华尔街!
整理 | 华卫 “谷歌超过四分之一的新代码是由人工智能生成的,然后由工程师审查和接受。”昨日,谷歌首席执行官 Sundar Pichai 在 2024 年第三季度财报电话会议...
LLM 比之前预想的更像人类,竟也能「三省吾身」
机器之心报道 编辑:Panda子曾经曰过:「见贤思齐焉,见不贤而内自省也。」自省可以帮助我们更好地认识自身和反思世界,对 AI 来说也同样如此吗? 近日,一个...
RAG新突破:块状注意力机制实现超低延迟检索增强
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
解决原生MLLM灾难性遗忘问题!上海AI Lab提出原生多模态大模型Mono-InternVL | 博士后研究员罗根讲座预告
现有的多模态大模型(MLLM)通常将预训练的视觉编码器与大语言模型结合来实现,即模块化MLLM。最近新兴的Chameleon、EVE等原生MLLM,将视觉感知和多模态理解...
意识理论之注意的伴随放电(CODAM)模型(一)
来源:本来实验室 概要 CODAM模型,即Corollary Discharge of Attention Movement模型,是由John G. Taylor等人提出的一种神经网络模型,其目的是解释意识体...
3B模型打通机器人任督二脉!冲咖啡叠衣服都能干,7种形态适配,OpenAI也投了
克雷西 发自 凹非寺量子位 | 公众号 QbitAI只要一个3B参数的大模型,就能控制机器人,帮你搞定各种家务。 叠衣服冲咖啡都能轻松拿捏,而且全都是由模型自主控...
【AI每日要闻】苹果收购Pixelmator拓展创意版图,谷歌开设首家线下零售店,三星布局XR头显设备,AI投资激增再创新高
要闻提示1. ? 苹果收购Pixelmator 加强创意工具布局 2. ? 萨姆·奥特曼:硬件足够实现通用AI 3. ?️ 苹果投资4亿美元扩展iPhone卫星服务 4. ? 谷歌将智能家居控...
大模型如何进入业务?百川智能推出“1+3”产品矩阵,核心模型打差异化
作者 | 褚杏娟 10 月 31 日,百川智能推出一站式大模型商业化解决方案,即 1+3 产品矩阵(全链路优质通用训练数据,Baichuan4-Turbo、Baichuan4-Air 两款模...
全球首款AI游戏诞生!无需游戏引擎,视频模型直出「我的世界」
新智元报道编辑:乔杨 十二 【新智元导读】无需游戏引擎,视频基座模型直出实时交互可玩的Minecraft,初创公司Decart和Etched打造的Oasis已经做到了这一点。...
每帧都是AI实时生成的,全球首款AI游戏问世了!
机器之心报道 编辑:佳琪、泽南欢迎来到 Transformer 的世界。两个月前,我们对 AI 游戏的认知刚刚被谷歌 GameNGen 颠覆。他们实现了历史性的突破,从此不再...
MetaGPT开源SELA,用AI设计AI,效果超越OpenAI使用的AIDE
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
NeurIPS 2024|浙大 & 微信 & 清华:彻底解决扩散模型反演问题
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
清华团队革新MoE架构!像搭积木一样构建大模型,提出新型类脑稀疏模块化架构
CFM团队 投稿量子位 | 公众号 QbitAI探索更高效的模型架构, MoE是最具代表性的方向之一。 MoE架构的主要优势是利用稀疏激活的性质,将大模型拆解成若干功能...
多图场景用DPO对齐!上海AI实验室等提出新方法,无需人工标注
刘子煜 投稿量子位 | 公众号 QbitAI多图像场景也能用DPO方法来对齐了! 由上海交大、上海AI实验室、港中文等带来最新成果MIA-DPO。 这是一个面向大型视觉语言...
粤公网安备 44011502001135号