马毅LeCun谢赛宁曝出多模态LLM重大缺陷!开创性研究显著增强视觉理解能力
新智元报道编辑:润 好困 【新智元导读】来自纽约大学和UC伯克利的研究团队成功捕捉到了多模态大模型在视觉理解方面存在的重大缺陷。针对这个问题,他们进一...
GPT-5不叫GPT-5?OpenAI CEO曝出AGI即将来临,重点押注核聚变
新智元报道编辑:润 好困 【新智元导读】Altman在达沃斯论坛上表示,AGI不远了,因为技术的发展是指数级的,但是人类不用过于担心会被AI所取代,而未来限制AI...
几何纹理重建新SOTA!浙大提出SIFU:单图即可重建高质量3D人体模型
新智元报道编辑:LRS 【新智元导读】最近来自浙江大学ReLER实验室的研究人员提出SIFU模型,一种侧视图条件隐函数模型用于单张图片3D人体重建。模型通过引入人...
ConvNet与Transformer谁更强?Meta评测4个领先视觉模型,LeCun转赞
新智元报道编辑:桃子 【新智元导读】当前的视觉模型哪个更好?Meta团队最新一波研究来了。如何根据特定需求选择视觉模型? ConvNet/ViT、supervised/CLIP模...
练习时长两年半,马斯克的机器人还没学会「叠衣服」?!
大数据文摘授权转载自夕小瑶科技说 作者:小戏、王二狗 继上个月马斯克没有任何预告,直接发布特斯拉人形机器人「Optimus」第二代后,今天马斯克在推特上又给...
机器人修路,是科技还是玄学?
大数据文摘授权转载自机器人大讲堂 作者:Jack 英国目前正积极将人工智能和机器人技术落地各类场景应用。近日,一个利用 AI 技术实现修路的机器人正在英国赫...
三星首款 AI 手机发布!这些新功能或将改变你用手机的习惯
三星首款 AI 手机发布今天凌晨,三星发布了它的首款 AI 手机 Galaxy S24 系列。 纵观整场发布会,从实用的通话实时翻译,到便捷的即圈即搜功能;从图片 AI 编...
比最优技术快 8 倍:浙大侯廷军等人提出 ResGen,基于蛋白质口袋的 3D 分子生成模型
作者:彬彬 编辑:李宝珠,三羊 浙江大学与之江实验室研究团队提出了一种基于蛋白质口袋 (protein pocket) 的 3D 分子生成模型——ResGen,与以往最优技术相比...
奥数能力金牌级:DeepMind几何推理模型登上Nature,代码开源,菲尔兹奖得主点赞
机器之心报道 编辑:泽南、陈萍这项工作代表了 AI 在数学推理上的能力突破,是开发通用 AI 系统方面的重要里程碑。 这一次,人工智能算法在数学奥林匹克竞赛...
模型越大,性能越好?苹果自回归视觉模型AIM:没错
机器之心报道 编辑:蛋酱、杜伟视觉模型,同样遵循「参数越多性能越强」的规律?刚刚,一项来自苹果公司的研究验证了这个猜想。 过去几年,大规模预训练模型...
三个臭皮匠顶个诸葛亮?可能是真的,已证实混合多个小模型性能比肩GPT3.5
机器之心报道 编辑:rome对模型参数量的迷信、执念也许可以放下了,混合多个小模型也是未来构造对话型 AI 的一个光明的方向。 在对话型人工智能(AI)研究中...
新一代注意力机制Lightning Attention-2:无限序列长度、恒定算力开销、更高建模精度
机器之心专栏 机器之心编辑部Lightning Attention-2 是一种新型的线性注意力机制,让长序列的训练和推理成本与 1K 序列长度的一致。 大语言模型序列长度的限...
参会指南|倒计时 2 天,AI 视频生成论坛即将开启!
「视频生成前沿研究与应用」机器之心 AI 技术论坛将于本周六(1月20日)正式开启。本次活动是 2024 年机器之心主办的首场线下交流活动,期待到场的朋友们都能...
LMDrive: 大语言模型加持的闭环端到端自动驾驶框架
直播预告 | 1月22日晚7点,「自动驾驶新青年讲座」第35讲正式开讲,LMDrive一作、香港中文大学MMLab在读博士邵昊将主讲《LMDrive:大语言模型加持的闭环端到...
粤公网安备 44011502001135号