AIGC动态

从零复现Llama3代码库爆火,大神Kapathy一键三连,GitHub狂揽2k+

西风 发自 凹非寺量子位 | 公众号 QbitAI让大神Andrej Karpathy一键三连❤️(点赞+转发+评论),一个教你从头开始实现Llama3的代码库爆火。 X上转赞收藏量超6....
阅读原文

LoRA数学编程任务不敌全量微调 | 哥大&Databricks新研究

克雷西 发自 凹非寺量子位 | 公众号 QbitAI大数据巨头Databricks与哥伦比亚大学最新研究发现,在数学和编程任务上,LoRA干不过全量微调。 具体来说,在这两种...
阅读原文

将大模型疯狂用到军事上,这家企业创始人“疯了”?

整理 | 褚杏娟、核子可乐讨论将 AI 应用于战争,这家企业“疯了”! 5 月 7 号到 8 号,华盛顿特区举办了一场特别的大会。此次会议的主赞助商则是由美国企业家...
阅读原文

发布屡次截胡?OpenAI与谷歌携新版大模型再度交锋 | 大模型一周大事

大模型的快节奏发展,让了解最新技术动态、积极主动学习成为每一位从业者的必修课。InfoQ 研究中心期望通过每周更新大模型行业最新动态,为广大读者提供全面...
阅读原文

爆打多模态王者 GPT-4V、Gemini Pro!这个小小端侧模型杀疯了!

夕小瑶科技说 分享多模态王者 GPT-4V、Gemini Pro ,竟然被一个端侧模型打爆了!而且这个模型还凭强劲实力拿下了全球最强端侧多模态模型王座! 有图有真相。...
阅读原文

今日arXiv最热大模型论文:Agent也疯狂!FoA方法对智能体做树结构搜索,超越ToT

夕小瑶科技说 原创作者 | 谢年年大模型agents包揽了从理解问题、规划任务、记忆输入输出、精准调用工具,执行任务解决问题的全过程,更厉害的是,它们还有自...
阅读原文

AI一键"搬空"你未来的新家,买房装修变得简单了?

夕小瑶科技说 原创作者 | Richard大家肯定都幻想过,要是能按自己的想法随心所欲布置新家该多好啊。租房或买房时看中一处房子,如果能在看房前先把家具'搬空'...
阅读原文

甲对话火山引擎总裁谭待:大模型后发也可以制胜|甲子光年

只有最大的使用量才能打磨出最好的模型,也只有最好的模型才有最大的使用量。作者|甲小姐 王艺‍‍‍ 编辑|刘杨楠 “价格战”,是大模型市场继参数量、长文本、...
阅读原文

生成式AI到底怎么赚钱?|甲子引力X

赚钱才是硬道理。2024年5月15日,由北京甲子光年科技服务有限公司主办,中关村东升科学城协办的「AI创生时代——2024甲子引力X科技向」大会在北京中关村东升科...
阅读原文

众包新玩法!LLM竞技场诞生基准测试,严格分离学渣学霸

新智元报道编辑:alan 【新智元导读】最公平的大模型基准测试诞生了!来自LLM竞技场,最接近人类偏好,数据新鲜、速度快、成本低,严格分离学渣和学霸。大模...
阅读原文

国产「小钢炮」一夜干翻巨无霸GPT-4V、Gemini Pro!稳坐端侧多模态铁王座

新智元报道编辑:桃子 好困 【新智元导读】杀疯了!一夜之间,全球最强端侧多模态模型再次刷新,仅用8B参数,击败了多模态巨无霸Gemini Pro、GPT-4V。而且,...
阅读原文

谷歌数学版Gemini奥赛难题,堪比人类数学家!

新智元报道编辑:编辑部 【新智元导读】I/O大会上,谷歌Gemini 1.5 Pro一系列更新让开发者们再次沸腾。最新技术报告中,最引人注目的一点是,数学专业版1.5 P...
阅读原文

150B token从头训练,普林斯顿Meta发布完全可微MoE架构Lory

新智元报道编辑:乔杨 好困 【新智元导读】前几天,普林斯顿大学联合Meta在arXiv上发表了他们最新的研究成果——Lory模型,论文提出构建完全可微的MoE模型,是...
阅读原文

时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

新智元报道编辑:庸庸乔杨 【新智元导读】 5月14日,开源的大语言模型Falcon 2发布,性能超越Llama 3,消息登上了Hacker News热榜第一。「猎鹰」归来,开源宇...
阅读原文

国产端侧小模型超越 GPT-4V,「多模态」能力飞升

端侧大模型的解耦难题:是模型适配终端,还是终端适配模型?作者 | 西西 编辑 | 陈彩娴 在刚刚过去的机器人学术顶会 ICRA 2024 上,「具身智能」成为热议,其...
阅读原文