终于有人调查了小模型过拟合:三分之二都有数据污染,微软Phi-3、Mixtral 8x22B被点名
机器之心报道 编辑:佳琪、蛋酱当前最火的大模型,竟然三分之二都存在过拟合问题? 刚刚出炉的一项研究,让领域内的许多研究者有点意外。提高大型语言模型的...
2023 IBM博士生奖学金华人占六成:Vicuna作者吴章昊、清华特奖得主高天宇入选
机器之心报道 编辑:佳琪近日,2023 年 IBM 博士生奖学金计划名单公布。 自 1951 年以来,IBM 通过极具竞争力的博士生奖学金(IBM PhD Fellowship Award)计...
小模型性能饱和、表现不佳,根源是因为Softmax?
机器之心报道 编辑:陈萍小语言模型的出现是为弥补大语言模型的训练、推理等成本昂贵的缺点,但其自身也存在训练到某个阶段后性能下降的事实 (饱和现象),那...
CVPR 2024 Highlight | 基于单曝光压缩成像,不依赖生成模型也能从单张图像中重建三维场景
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
辉瑞 AI 方法登 Science,揭示数以万计的配体-蛋白质相互作用
将 ScienceAI设为星标 第一时间掌握 新鲜的 AI for Science 资讯编辑 |X 尽管蛋白质结构预测取得了重大进展。但对于 80% 以上的蛋白质,迄今为止尚未发现小分...
拒稿4次,终获顶会!ICML 2024放榜:投稿量近万篇,审稿意见下滑严重
新智元报道编辑:桃子 LRS 【新智元导读】一年一度的ICML 2024录用结果出炉!今年投稿量再涨3000+,达到9653,审稿意见质量太差,AC还得重读论文才能确定结论...
奥特曼本人确认:神秘gpt2不是GPT-4.5!
新智元报道编辑:桃子 LRS 【新智元导读】Altman本人确认,神秘gpt2-chatbot不是GPT-4.5。OpenAI下一代LLM还未确认何时发布,但搜索引擎似乎已经准备上线了。...
AI入尔街,金领不金!高盛、摩根大通:66%初级分析师或将被取代
新智元报道编辑:拉燕 【新智元导读】AI的威力开始在银行业显现!据说,金融分析软件苏格拉底入驻华尔街,三分之二初级分析师将不再需要。AI又把「魔爪」伸向...
奥特曼承认了神秘gpt2!哈佛MIT巡演继续,斯坦福演讲完整版公开
梦晨 西风 发自 凹非寺量子位 | 公众号 QbitAI奥特曼斯坦福爆火演讲,完整版录像公开了! 这还只是第一站,在哈佛和MIT再次发现了他的身影。 特别是在哈佛,...
美图吴欣鸿:国产Sora竞争关键,在创意、工作流和垂直场景 | 中国AIGC产业峰会
编辑部 整理自 AIGC峰会量子位 | 公众号 QbitAI全球AIGC应用浪潮下,怎样将大模型产品以一种更贴近消费者的形式融入生产力工具? 这,或许是AI在生产力场景延...
一次预测多个token,Meta新模型推理加速3倍,编程任务提高17%
梦晨 西风 发自 凹非寺量子位 | 公众号 QbitAI“预测下一个token”被认为是大模型的基本范式,一次预测多个tokens又会怎样? Meta AI法国团队推出“基于多token...
雷军周鸿祎出圈:中年CEO,抢着当网红
大数据文摘受权转载自定焦 作者 | 苏琦 编辑 | 金玙璠今年年初,360公司创始人周鸿祎就呼吁,“如果有可能,我认为企业家都要去当网红”。现在看来,他也是这么...
新 iPad 下周就来,准备官宣 AI 的苹果,怎么卖不动 iPhone 了?
左右为难今年以来,全球手机市场迎来了新的机遇和挑战—— AI 如何与设备更好地结合? 苹果很多技术应用都不是最先发布的,甚至在大部分厂商都大举跟进 AI 功能...
MIT校长对话OpenAI CEO:GPT-5或将数据与推理引擎分离|甲子光年
OpenAI只做工具,人类充满偏见却不自知。作者|苏霍伊 编辑|田思奇 发自美国麻省理工学院 继4月24日科技界的“顶流”,OpenAI首席执行官萨姆·奥尔特曼(Sam Al...
库克:上季度中国大陆的 iPhone 销量实现增长/990 万拍下周鸿祎迈当事人:已完成支付/小米回应大压铸自研问题
? 苹果第二财季营收净利润均超预期 ? 990 万拍下周鸿祎迈巴赫当事人:已完成支付 ? 特斯拉裁员潮又有新的受害者 ? 小米公司发言人:有人故意混淆超级大压铸系...
粤公网安备 44011502001135号