Transformer正在耗尽Transformer|甲子光年

新的GPT还没来,AI数据中心先遇到困难了。作者|艾伦‍‍ 编辑|王博 赵健‍ 模型微调平台OpenPipe创始人Kyle Corbitt近期爆了一个料。 他与微软工程师的聊天中...
阅读原文

千元成本落地专属大模型的时代来了!|甲子光年

AI 1.0公司如何迎接AI 2.0?作者|赵健 从ChatGPT到Sora,从文生文、文生图像到文生视频,大模型发展日新月异,持续给行业带来惊喜,不仅国内掀起“百模大战”...
阅读原文

Transformer并非万能:Jamba在效率和吞吐量上大幅超越

点击上方蓝字关注我们“AI21 Labs推出Jamba,一种结合SSM与transformers的新AI模型,旨在提高处理长上下文的效率。Jamba在特定推理任务上超越传统模型,尽管在...
阅读原文

人工审核即将被淘汰? 谷歌“超人”AI不仅准确还便宜20倍!

点击上方蓝字关注我们“Google DeepMind的最新研究提出了SAFE,一种创新的长篇幅事实性评估方法,通过利用LLMs自动分解和验证事实,显著提高了评估的准确性和...
阅读原文

马斯克发布Grok 1.5,追了一年,仍落后于GPT-4和Claude3

点击上方蓝字关注我们“xAI公司近日推出了Grok-1.5 AI模型,具备强大的推理能力和处理高达10万字文本的能力。在多项基准测试中表现优异,尽管与市场领先产品GP...
阅读原文

Sora 的算力困局:如果正式推出,可能需要 72 万张 H100

在上个月推出视频生成模型 Sora 后,就在昨天,OpenAI 又发布了一系列创意工作者借助 Sora 进行的创作,效果极为惊艳。毫无疑问,就生成质量,Sora 是迄今为...
阅读原文

基础模型、长文本、数据库、应用落地:读懂大模型行业的关键问题

3 月 23 日-24 日,聚焦全球开发者精英,由上海市人工智能行业协会(SAIA)主办的 2024 全球开发者先锋大会(2024 GDC)在上海举办。 这场大会是中国大模型公...
阅读原文

大模型预测,下一个token何必是文字?

明敏 金磊 发自 凹非寺量子位 | 公众号 QbitAI太快了太快了… 大模型的生成技能,已经到了普通人看不懂的境界! 它可以根据用户过去5年的体检报告,生成未来第...
阅读原文

博鳌热议AI大模型,人民网报告梳理产业机遇:端云结合、芯片、开源

明敏 发自 凹非寺量子位 | 公众号 QbitAI中国大模型产业该怎么看? 最新权威参考来了。 博鳌亚洲论坛2024年年会期间,人民网正式发布《2024年中国AI大模型产...
阅读原文

马斯克突发Grok 1.5!上下文长度至128k、HumanEval得分超GPT-4

丰色 西风 发自 凹非寺量子位 | 公众号 QbitAI就在刚刚,马斯克Grok大模型宣布重大升级。 难怪之前突然开源了Grok-1,因为他有更强的Grok-1.5了,主打推理能...
阅读原文

吉娃娃or松饼难题被解决!IDEA研究院新模型打通文本视觉Prompt,连黑客帝国的都能数清楚

白交 发自 凹非寺量子位 | 公众号 QbitAI还记得黑客帝国经典的子弹时间吗? IDEA研究院最新检测模型T-Rex2,可以齐刷刷给全部识别出来~ 而面对难倒一众大模型...
阅读原文

Mamba架构第一次做大!混合Transformer,打败Transformer

丰色 发自 凹非寺量子位 | 公众号 QbitAI精彩精彩,第一个把爆火Mamba架构真正扩展到足够大的工作来了。 520亿参数,还是Mamba+Transformer混合架构。 它的名...
阅读原文

⏰ 最后3天!AIGC评选报名即将截止,我们正在寻找值得关注的企业与产品——

组委会 发自 凹非寺量子位 | 公众号 QbitAI过去一年里AIGC产业风起云涌,无数优秀的企业、产品涌现而出。 更多企业投身于生成式AI的技术研发、产品创新,更有...
阅读原文

图灵奖得主杨立昆最新访谈实录:大语言模型的局限、世界模型、开源、未来希望

来源:图灵人工智能精 彩 观 点自回归大语言模型并非通向“超人智能”的途径,它们尚不具备理解物理世界、持久记忆、逻辑推理和行动规划等“人类水平智能”的关键...
阅读原文

谁将取代 Transformer?

来源:AI科技评论 作者:张进( AI科技评论) 2017年谷歌发表的论文《Attention Is All You Need》成为当下人工智能的一篇圣经,此后席卷全球的人工智能热潮...
阅读原文