比LoRA还快50%的微调方法来了!一张3090性能超越全参调优,UIUC联合LMFlow团队提出LISA
机器之心专栏 机器之心编辑部2022 年底,随着 ChatGPT 的爆火,人类正式进入了大模型时代。然而,训练大模型需要的时空消耗依然居高不下,给大模型的普及和发...
ICLR 2024 | 鸡生蛋蛋生鸡?再论生成数据能否帮助模型训练
机器之心专栏 机器之心编辑部随着生成模型(如 ChatGPT、扩散模型)飞速发展,一方面,生成数据质量越来越高,到了以假乱真的程度;另一方面,随着模型越来越...
最神秘国产大模型团队冒泡,一出手就是万亿参数MoE,两款应用敞开玩
衡宇 艳艳 发自 凹非寺量子位 | 公众号 QbitAI国内基础大模型创业公司,最后一位强实力选手终于正式来到台前。 它就是微软前全球副总裁姜大昕所创办的阶跃星...
机器狗首次阵亡!美国警方披露详情
白交 发自 凹非寺量子位 | 公众号 QbitAI那天,唯一的伤亡者是我们的机器狗。 美国警察最新公布一则案件:波士顿动力机器狗首次被枪杀阵亡。 官方图显示,机...
大模型实时打《街霸》捉对PK,GPT-4居然不敌3.5,新型Benchmark火了
梦晨 发自 凹非寺量子位 | 公众号 QbitAI让大模型直接操纵格斗游戏《街霸》里的角色,捉对PK,谁更能打? GitHub上一种你没有见过的船新Benchmark火了。 与ll...
0门槛免费商用!孟子3-13B大模型正式开源,万亿token数据训练
白交 发自 凹非寺量子位 | 公众号 QbitAI澜舟科技官宣:孟子3-13B大模型正式开源! 这一主打高性价比的轻量化大模型,面向学术研究完全开放,并支持免费商用...
XZ恶意代码潜伏三年,差点引发核末日?投毒黑客身份成谜
新智元报道编辑:好困 Aeneas 【新智元导读】这个周末,开源软件xz后门事件,直接引发了安全界地震!一段恶意代码被悄悄植入了,险些波及各大Linux系统。好在...
谷歌狂喜:JAX性能超越Pytorch、TensorFlow!或成GPU推理训练最快选择
新智元报道编辑:编辑部 【新智元导读】JAX在最近的基准测试中的性能已经不声不响地超过了Pytorch和TensorFlow,也许未来会有更多的大模型诞生在这个平台上。...
DeepMind首发游戏AI智能体SIMA!只用自然语言就能玩转「山羊模拟器」
新智元报道编辑:Mindy 【新智元导读】AI在学会工作之后,终于也能和人一样玩游戏了!DeepMind的SIMA是一个可以感知和理解各种环境的AI代理,能够在多种视频...
基于 7 大城市实景数据,清华大学团队开源 GPD 模型
作者:李宝珠 编辑:三羊 清华大学电子工程系城市科学与计算研究中心提出 GPD 模型,利用扩散模型生成神经网络参数,将时空少样本学习转变为扩散模型的预训练...
小米 SU7 创始版再次开售,为什么最值得买的不是顶配?
感性选小米 理性选车型今天中午 12:00,小米 SU7 创始版追加开售。 小米官方称,它们在 SU7 创始版定购过程中,识别、拦截了部分异常订单、黄牛订单,因此才...
宫崎骏看完 AI 制作的动画:强烈感受到对生命的侮辱 | Hunt Good 周报
欢迎收看最新一期的 Hunt Good 周报! 在本期内容你会看到: 5 条新鲜资讯3 个有用工具1 个有趣案例4 个鲜明观点 Hunt for News|先进头条 ? GPT Store 开启...
融合RL与LLM思想,探寻世界模型以迈向AGI「中·下篇」
本篇文章与2023年底尝试挖掘并探寻以chatGPT为代表的LLM和以AlphaGO/AlphaZero及当下AlphaDev为代表的RL思想的背后底层理论及形式上的统一,同时与最近OpenAI...
小米汽车副总裁回应近期/华为 P70 全系入网,或在 4 月亮相/OpenAI 首次展示音频模型
? OpenAI 首次展示音频模型 ? 马斯克认同乔布斯人才观 ? 微软携手 OpenAI 投入 1000 亿美元打造新 AI 超算 ? 小米汽车副总裁回应近期风波 ? 《 GTA 6 》被曝...
吴恩达红杉美国 AI 峰会谈 Agent Workflow 以及 4 种主流设计模式,相比 LLM 更强调迭代与对话
智猩猩与智东西将于4月18-19日在北京共同举办2024中国生成式AI大会,爱诗科技创始人王长虎,启明创投合伙人周志峰,Open-Sora开发团队潞晨科技创始人尤洋,「...
粤公网安备 44011502001135号