Transformer正在耗尽Transformer|甲子光年
新的GPT还没来,AI数据中心先遇到困难了。作者|艾伦 编辑|王博 赵健 模型微调平台OpenPipe创始人Kyle Corbitt近期爆了一个料。 他与微软工程师的聊天中...
千元成本落地专属大模型的时代来了!|甲子光年
AI 1.0公司如何迎接AI 2.0?作者|赵健 从ChatGPT到Sora,从文生文、文生图像到文生视频,大模型发展日新月异,持续给行业带来惊喜,不仅国内掀起“百模大战”...
Transformer并非万能:Jamba在效率和吞吐量上大幅超越
点击上方蓝字关注我们“AI21 Labs推出Jamba,一种结合SSM与transformers的新AI模型,旨在提高处理长上下文的效率。Jamba在特定推理任务上超越传统模型,尽管在...
人工审核即将被淘汰? 谷歌“超人”AI不仅准确还便宜20倍!
点击上方蓝字关注我们“Google DeepMind的最新研究提出了SAFE,一种创新的长篇幅事实性评估方法,通过利用LLMs自动分解和验证事实,显著提高了评估的准确性和...
马斯克发布Grok 1.5,追了一年,仍落后于GPT-4和Claude3
点击上方蓝字关注我们“xAI公司近日推出了Grok-1.5 AI模型,具备强大的推理能力和处理高达10万字文本的能力。在多项基准测试中表现优异,尽管与市场领先产品GP...
Sora 的算力困局:如果正式推出,可能需要 72 万张 H100
在上个月推出视频生成模型 Sora 后,就在昨天,OpenAI 又发布了一系列创意工作者借助 Sora 进行的创作,效果极为惊艳。毫无疑问,就生成质量,Sora 是迄今为...
基础模型、长文本、数据库、应用落地:读懂大模型行业的关键问题
3 月 23 日-24 日,聚焦全球开发者精英,由上海市人工智能行业协会(SAIA)主办的 2024 全球开发者先锋大会(2024 GDC)在上海举办。 这场大会是中国大模型公...
大模型预测,下一个token何必是文字?
明敏 金磊 发自 凹非寺量子位 | 公众号 QbitAI太快了太快了… 大模型的生成技能,已经到了普通人看不懂的境界! 它可以根据用户过去5年的体检报告,生成未来第...
博鳌热议AI大模型,人民网报告梳理产业机遇:端云结合、芯片、开源
明敏 发自 凹非寺量子位 | 公众号 QbitAI中国大模型产业该怎么看? 最新权威参考来了。 博鳌亚洲论坛2024年年会期间,人民网正式发布《2024年中国AI大模型产...
马斯克突发Grok 1.5!上下文长度至128k、HumanEval得分超GPT-4
丰色 西风 发自 凹非寺量子位 | 公众号 QbitAI就在刚刚,马斯克Grok大模型宣布重大升级。 难怪之前突然开源了Grok-1,因为他有更强的Grok-1.5了,主打推理能...
吉娃娃or松饼难题被解决!IDEA研究院新模型打通文本视觉Prompt,连黑客帝国的都能数清楚
白交 发自 凹非寺量子位 | 公众号 QbitAI还记得黑客帝国经典的子弹时间吗? IDEA研究院最新检测模型T-Rex2,可以齐刷刷给全部识别出来~ 而面对难倒一众大模型...
Mamba架构第一次做大!混合Transformer,打败Transformer
丰色 发自 凹非寺量子位 | 公众号 QbitAI精彩精彩,第一个把爆火Mamba架构真正扩展到足够大的工作来了。 520亿参数,还是Mamba+Transformer混合架构。 它的名...
⏰ 最后3天!AIGC评选报名即将截止,我们正在寻找值得关注的企业与产品——
组委会 发自 凹非寺量子位 | 公众号 QbitAI过去一年里AIGC产业风起云涌,无数优秀的企业、产品涌现而出。 更多企业投身于生成式AI的技术研发、产品创新,更有...
图灵奖得主杨立昆最新访谈实录:大语言模型的局限、世界模型、开源、未来希望
来源:图灵人工智能精 彩 观 点自回归大语言模型并非通向“超人智能”的途径,它们尚不具备理解物理世界、持久记忆、逻辑推理和行动规划等“人类水平智能”的关键...
谁将取代 Transformer?
来源:AI科技评论 作者:张进( AI科技评论) 2017年谷歌发表的论文《Attention Is All You Need》成为当下人工智能的一篇圣经,此后席卷全球的人工智能热潮...
粤公网安备 44011502001135号