Nature:科学家首次利用 AI 设计抗体

点击上方蓝字关注我们“科学家首次使用人工智能(AI)成功设计出全新的抗体,这一成就被视为该领域的里程碑。通过AI工具RFdiffusion,研究人员能够设计出能识...
阅读原文

OpenAI公关跳起来捂他嘴:Transformer作者公开承认参与Q*!|八位作者最新专访

梦晨 发自 凹非寺量子位 | 公众号 QbitAITransformer作者中唯一去了OpenAI的那位,公开承认了: 他参与了Q*项目,是这项新技术的发明者之一。 这几天除了英伟...
阅读原文

3140参数Grok-1推理加速3.8倍,PyTorch+HuggingFace版来了

明敏 发自 凹非寺量子位 | 公众号 QbitAI马斯克说到做到开源Grok-1,开源社区一片狂喜。 但基于Grok-1做改动or商用,都还有点难题: Grok-1使用Rust+JAX构建...
阅读原文

《宫保鸡丁》杀入全球AI音乐榜前十!音乐版ChatGPT被玩疯了

白交 发自 凹非寺量子位 | 公众号 QbitAI等等,用菜谱做歌词?! 当《宫保鸡丁》碰上音乐剧,瞬间高大上了起来~于是这首歌随即登上了全球AI音乐热门榜前十。 ...
阅读原文

模型合并就进化,直接拿下SOTA!Transformer作者创业新成果火了

丰色 发自 凹非寺量子位 | 公众号 QbitAI把Huggingface上的现成模型拿来“攒一攒”—— 直接就能组合出新的强大模型?! 日本大模型公司sakana.ai脑洞大开(正是“...
阅读原文

兆级长文本,已是一线大模型机构标配能力丨上海AI Lab林达华

衡宇 发自 阿拉上海量子位 | 公众号 QbitAI“据我了解,国内多个一线大模型机构,都已经突破了兆级的长文本能力。” 以上,是“2024全球开发者先锋大会”大模型前...
阅读原文

全面解析LoRA、QLoRA、RLHF,PPO,DPO,Flash Attention、增量学习等大模型算法

随着大模型的飞速发展,在短短一年间就有了大幅度的技术迭代更新,从LoRA、QLoRA、AdaLoRa、ZeroQuant、Flash Attention、KTO、蒸馏技术到模型增量学习、数据...
阅读原文

今日arXiv最热NLP大模型论文:微软重磅:AgentAI,下一代人工智能的关键

夕小瑶科技说 原创作者 | Tscom 引言:AI的全面智能之路人工智能的发展已从简单算法进化到复杂的大型基础模型,尤其在理解开放世界环境中的感官信息方面取得...
阅读原文

哈工深提出基于联邦学习的大模型指令微调

夕小瑶科技说 原创作者 | 松果引言:面对数据匮乏与隐私挑战的联邦指令调整在当今大语言模型(LLMs)发展中,指令调整被证明对于生成与人类对齐的响应至关重...
阅读原文

词曲创作只需几秒,「AI作曲家」Suno引爆音乐圈,第一手体验和攻略来了

机器之心报道 编辑:杜伟、蛋酱有了 Suno 这个「作曲助手」,人人都可以创建自己想听的歌曲。自从 ChatGPT 在 2022 年底爆火以来,我们已经看到 AI 生成的诸...
阅读原文

离职谷歌的Transformer作者创业,3个模型(附技术报告)

机器之心报道 编辑:陈萍、小舟去年 8 月,两位著名的前谷歌研究人员 David Ha、Llion Jones 宣布创立一家人工智能公司 Sakana AI,总部位于日本东京。其中,...
阅读原文

讨论下一个token预测时,我们可能正在走进陷阱

机器之心报道 编辑:赵阳自香农在《通信的数学原理》一书中提出「下一个 token 预测任务」之后,这一概念逐渐成为现代语言模型的核心部分。最近,围绕下一个 ...
阅读原文

剑桥团队开源:赋能多模态大模型RAG应用,首个预训练通用多模态后期交互知识检索器

机器之心专栏 机器之心编辑部PreFLMR模型是一个通用的预训练多模态知识检索器,可用于搭建多模态RAG应用。模型基于发表于 NeurIPS 2023 的 Fine-grained Late...
阅读原文

通用文档理解新SOTA,多模态大模型TextMonkey来了

机器之心专栏 机器之心编辑部最近,华中科技大学和金山的研究人员在多模态大模型 Monkey [1](Li et al., CVPR2024)工作的基础上提出 TextMonkey。在多个场...
阅读原文

中电信星辰AI大模型TeleChat-7B评测

智猩猩与智东西将于4月18-19日在北京共同举办2024中国生成式AI大会,阿里巴巴通义千问大模型技术负责人周畅,「清华系Sora」生数科技CEO唐家渝,云天励飞“云...
阅读原文