AIGC动态

CVPR 2024|文本或图像提示精准编辑 3D 场景,美图&信工所&北航&中大联合提出 3D 编辑方法 CustomNeRF

作者 | 美图影像研究院 美图影像研究院(MT Lab)与中国科学院信息工程研究所、北京航空航天大学、中山大学共同提出了 3D 场景编辑方法——CustomNeRF,同时支...
阅读原文

波士顿动力Atlas,再见!退役视频引数十万观众泪目,液压退出历史舞台

新智元报道编辑:编辑部 【新智元导读】波士顿动力的Atlas,今日正式宣布退役!在最后一段告别视频里,它依然在奔跑、跳跃、后空翻、甚至摔倒在地,从膝盖喷...
阅读原文

看懂网飞版「三体」!Reka Core登场:挑战GPT-4、Claude 3

新智元报道编辑:flynne 【新智元导读】AI初创公司Reka最新推出的多模态语言模型Reka Core具备理解图像、音频和视频等多种模式数据内容的惊人能力,是继谷歌...
阅读原文

用MoE横扫99个子任务!浙大等提出全新通用机器人策略GeRM

新智元报道编辑:LRS 【新智元导读】本文分享论文GeRM: A Generalist Robotic Model with Mixture-of-experts for Quadruped Robot,由西湖大学和浙江大学联...
阅读原文

只要会说话,不写代码也能开发!百度又搞了一个大动作

新智元报道编辑:编辑部 【新智元导读】文心大模型4.0,半年时间又提升了52.5%,在智能体、代码、多模型上也有了新进展!像人一样思考的智能体,达到了一定程...
阅读原文

新架构掀翻Transformer!无限上下文处理,2万亿token碾压Llama 2

新智元报道编辑:桃子 好困 【新智元导读】Transformer王座即将被取而代之!Meta、USC、CMU和UCSD联合提出了革命性新架构Megalodon,能够处理无限上下文,在2...
阅读原文

H800竟然能白嫖了!还能一键部署Open Sora,潞晨云YYDS!

ChatGPT和Sora等AI大模型应用,将AI大模型和算力需求的热度不断带上新的台阶。 如何获得廉价算力,进行AI视频生成等模型开发和应用呢? 前不久,潞晨科技全面...
阅读原文

今日arXiv最热NLP大模型论文:斯坦福发布法律指令数据集LawInstruct,统一17个辖区24种语言

夕小瑶科技说 原创作者 | Tscom引言:法律领域的语言模型挑战与进展在法律领域,语言模型(Language Models, LLMs)的发展一直面临着独特的挑战。法律文本的...
阅读原文

离世界模型更近一步!Meta开源OpenEQA,评估AI Agent情景理解能力

夕小瑶科技说 原创作者 | 任同学Yann LeCun 朝着 “世界模型” 又近了一步。 Meta最新的开源工作OpenEQA:从文字模型到世界模型,可以像人一样记忆、推理的新基...
阅读原文

用 Vision Pro 逛了一下午淘宝,我发现了一种很新的网购方式

淘宝 三维化未来的网购会是怎样的? 足不出户,就能看见商品的 3D 展示;不仅能把产品放大看细节,还能还原 1:1 的真实比例,放在房间的任何角落看看尺寸是否...
阅读原文

小米 SU7 撞上墙,轮不到刹车片背锅

一直以来,赛道上的故事往往只在赛车爱好者间传播,但在上周,一起发生在上海天马赛车场的事故打破了这个边界,成为了社交媒体上热议的焦点。 只因上墙的是小...
阅读原文

索尼 PS5 Pro 或年底发布,开发者已收到适配通知

PS5 PRO 即将发布‍ 距离索尼发布 PS5 已经过去三年多了,其全球销量也已经达到了惊人的四千多万台。 现在,它的升级款有新消息了。有爆料称今年 11 月份,会...
阅读原文

中国AIGC最值得关注企业&产品榜单揭晓!首份应用全景图谱发布

组委会发自 凹非寺量子位 | 公众号 QbitAI“你好,新应用!” 站在大模型落地元年,是时候喊出这句话了。 从软件APP、智能终端乃至具身智能等等,AIGC开始席卷...
阅读原文

清华团队推出新平台:用去中心化AI打破算力荒

允中 发自 凹非寺量子位 | 公众号 QbitAI最近,一则数据点出了AI领域算力需求的惊人增长—— 根据业内专家的预估,OpenAI推出的Sora在训练环节大约需要在4200-1...
阅读原文

Pika联创参与新研究:Diffusion能抢GPT的活了!成功挑战自回归文本范式

丰色 发自 凹非寺量子位 | 公众号 QbitAI纵观生成式AI领域中的两个主导者:自回归和扩散模型。 一个专攻文本等离散数据,一个长于图像等连续数据。 如果,我...
阅读原文