AIGC动态

专访 OmniH2O 项目发起人何泰然:探索人形机器人遥操作通向具身智能的可行之路

最强的机器人模型一定不只有一种数据来源。作者丨饶舒玮 编辑丨岑峰 “既要又要”是何泰然的野心,也是决心。 在谈到人形机器人遥操作的可行路径时,何泰然表示...
阅读原文

打通大模型行业应用任督二脉!看讯飞星火如何做好大模型落地“必答题”

破解大模型落地最后一公里难题,科大讯飞甩出组合拳。 作者|程茜 编辑|漠影 智东西6月28日下午,昨日下午,科大讯飞的星火大模型迎来重磅升级,基于全国首个...
阅读原文

五大数字员工已上岗!讯飞星火让每个岗位都用上大模型

技术创新与产业落地双轮驱动,科大讯飞加速大模型赋能千行百业。 作者|程茜 编辑|漠影 智东西6月28日报道,昨天下午,全面对标GPT-4 Turbo的讯飞星火V4.0刚刚...
阅读原文

华东师范大学的老师,上课已经用上了大模型

金磊 梦晨 发自 凹非寺量子位 | 公众号 QbitAI人在华东师范大学,上课、教学已经用上了大模型。 例如丢一本《信息系统概论》进去,就可以开始提问了(哪里不...
阅读原文

炸裂!讯飞现场大秀强干扰语音识别,星火4.0霸榜八个榜单,74种语言交流

游鱼 发自 凹非寺量子位 | 公众号 QbitAI很炸裂!讯飞星火大秀语音识别能力,现场掌声雷动—— 三个人同时说话,再加上背景音乐,如此强干扰的场景,大模型却表...
阅读原文

AI首次实时生成视频!尤洋团队新作,网友:这是新纪元

一水 发自 凹非寺量子位 | 公众号 QbitAI尤洋团队新作,首个基于DiT的实时视频生成方法来了! 先来直观感受一下效果(右侧为新方法): 这是团队在Open-Sora...
阅读原文

谷歌开源系模型第二代免费开放!27B媲美LLaMA3 70B,单H100或TPU主机可跑

西风 发自 凹非寺量子位 | 公众号 QbitAI谷歌开源模型Gemma 2开放了! 虽然前段时间Google I/O大会上,Gemma 2开源的消息就已经被放出,但谷歌还留了个小惊喜...
阅读原文

陈丹琦团队图表解读新基准:新王Claude3.5刚及格,但已是模型最强推理表现

克雷西 发自 凹非寺量子位 | 公众号 QbitAIClaude 3.5 Sonnet的图表推理能力,比GPT-4o高出了27.8%。 针对多模态大模型在图表任务上的表现,陈丹琦团队提出了...
阅读原文

双向赋能:AI与数据库的修行之道

机器之心发布 来源:至顶网在这个数据为王的时代,数据是人工智能的三大支柱之一,其重要性不言而喻。最近,OpenAI 收购了数据库初创公司 Rockset,迅速引起...
阅读原文

Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

击败Gemini-1.5-Pro、GPT-4V,从容大模型多模态能力跻身全球前三

机器之心报道 机器之心编辑部近日,云从科技从容大模型在综合评测权威平台 OpenCompass 的多模态评测领域中取得重大进展。 最新评测结果显示,云从科技的从容...
阅读原文

谷歌「诚意之作」,开源9B、27B版Gemma2,主打高效、经济!

机器之心报道 机器之心编辑部性能翻倍的Gemma 2, 让同量级的Llama3怎么玩?‍‍AI赛道上,科技巨头们激烈角逐。前脚有GPT-4o问世,后脚就出现了Claude 3.5 Son...
阅读原文

300多篇相关研究,复旦、南洋理工最新多模态图像编辑综述论文

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

Vision Pro 国行版发售现场 | 我们和苹果副总裁聊了聊,佘诗曼杜海涛喜提「崭新时代」

Vision Pro 国行版今天正式开售,我们在北京见到了苹果零售高级副总裁 Deirdre O’Brien,和她单独聊了聊。 一条视频,让你彻底了解这些 Vision Pro 在国内首...
阅读原文

一加 Ace 3 Pro 体验:6100mAh 大电池配百瓦快充和三代骁龙 8,性能续航两手抓

性能和续航 我全都要更新了标准版和 V 系列之后,一加 Ace 系列第三世代的旗舰一加 Ace 3 Pro 终于来了。 这一代在性能配置上的升级,可以说是不留余力。 手...
阅读原文