标签:模型

100B 的「跨级」跃升!元象发布最大 MoE 开源大模型,「高性能全家桶」系列全部免费

作者 | 华卫 9 月 13 日,元象 XVERSE 发布中国最大 MoE 开源模型:XVERSE-MoE-A36B。该模型总参数 255B,激活参数 36B,能 达到 100B 模型的性能「跨级」跃...
阅读原文

o1完整思维链成OpenAI头号禁忌!问多了等着封号吧

梦晨 克雷西 发自 凹非寺量子位 | 公众号 QbitAI警告!不要在ChatGPT里问最新o1模型是怎么思考的—— 只要尝试几次,OpenAI就会发邮件威胁撤销你的使用资格。 ...
阅读原文

中国最大开源MoE模型,255B参数无条件免费商用,元象发布

允中 发自 凹非寺量子位 | 公众号 QbitAI元象XVERSE发布中国最大MoE开源模型: XVERSE-MoE-A36B,该模型总参数255B,激活参数36B,达到100B模型性能的「跨级...
阅读原文

AI一键生成“类黑神话”!腾讯推出游戏视频模型GameGen-O,业内人士:游戏工作室的ChatGPT时刻

一水 发自 凹非寺量子位 | 公众号 QbitAI什么?大模型也许很快就能生成《黑神话·悟空》这种3A大作了?! 直接看一则demo,《西游记》这就上桌: 搭配BGM,是...
阅读原文

一张图实现街道级定位,端到端图像地理定位大模型AddressCLIP登ECCV2024

AddressCLIP项目组 投稿量子位 | 公众号 QbitAI拔草星人的好消息来啦! 中科院自动化所和阿里云一起推出了街景定位大模型,只要一张照片就能实现街道级精度的...
阅读原文

OpenAI o1惊现自我意识?陶哲轩实测大受震撼,门萨智商100夺模型榜首

新智元报道编辑:编辑部 HXZ 【新智元导读】OpenAI o1,在门萨智商测试中果然取得了第一名。数学大神陶哲轩实测发现,o1竟然能成功识别出克莱姆定理。而OpenA...
阅读原文

李飞飞携24人最强天团打造「大世界模型」!Hinton站台力挺,获2.3亿融资

新智元报道编辑:编辑部 HYX 【新智元导读】李飞飞团队酝酿了5个月之久的创业公司,今天终于正式官宣了!目标是打造「大世界模型」,让AI在3D世界中感知、生...
阅读原文

南加大提出全新「通用时间序列」基础模型TimeDiT!基于扩散模型创新物理约束机制

新智元报道编辑:LRST 【新智元导读】通过结合去噪扩散模型和Transformer架构,TimeDiT可以有效处理时间序列的多通道、多分辨率和缺失值问题,并能整合物理知...
阅读原文

李飞飞任CEO,空间智能公司World Labs亮相,全明星阵容曝光

机器之心报道 机器之心编辑部World Labs 的创始团队中,有 ImageNet、NeRF、Style Transfer 和 Gaussian Splats 作者在列。人工智能的下个大方向已经出现,标...
阅读原文

张俊林:OpenAI o1的价值意义及强化学习的Scaling Law

机器之心转载 作者:新浪新技术研发负责人张俊林蹭下热度谈谈 OpenAI o1 的价值意义及 RL 的 Scaling law。 一、OpenAI o1 是大模型的巨大进步 我觉得 OpenAI...
阅读原文

首次!用合脸数据集训练的识别模型,性能高于真实数据集

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

MMLU-Pro基准测试数据集上线,含 12k 个跨学科复杂问题,难度提升,更具挑战性!DeepSeek 数学模型一键部署

在大语言模型 (LLM) 蓬勃发展的时代,诸如大规模多任务语言理解 (MMLU) 之类的基准测试,在推动 AI 于不同领域的语言理解与推理能力迈向极限方面,发挥着至关...
阅读原文

o1 让 AI 正式进入 L2 “推理者”阶段,但我们离 AGI 仍然遥远

点击上方蓝字关注我们“OpenAI 推出了 o1 新型 AI 模型,标志着 AI 进入了五级系统的第二级——推理者。o1 在科学、编程和数学任务中展现了显著的推理能力和自我...
阅读原文

为什么说 OpenAI o1是自Transformer以来最大的更新?

点击上方蓝字关注我们o1 是自 Transformer 技术以来最大的一次 AI 更新,但它并不是 AGI。OpenAI 确实在推动一些以前无法实现的关键进展,并为 AGI 铺平了道...

解密 OpenAI o1:那些不为人知的幕后细节

点击上方蓝字关注我们在今天与 OpenAI o1 团队的 AMA(Ask Me Anything)活动中,我们了解到了以下几点,有网友进行了整理,翻译如下: 模型名称与推理模式- ...