pipio

pipio是视频自动AI配音工具,能保留原始声音的同时进行视频翻译,精确匹配说话者的唇部运动,使新语言的配音看起来自然无痕。pipio口型匹配技术提升33%、零损...
阅读原文

最强开源CodeLLM模型深夜来袭!320亿参数,Qwen2.5-Coder新模型超越GPT-4o

小明 发自 凹非寺量子位 | 公众号 QbitAI一夜之间,AI编程模型的开源王座易主了! Qwen2.5-Coder-32B正式发布,霸气拿下多个主流基准测试SOTA,彻底登上全球...
阅读原文

马斯克招人策略曝光:9轮面试,底薪低于同行,只招“铁杆特斯拉人”

一水 发自 凹非寺量子位 | 公众号 QbitAI要想进入特斯拉,先得接受低底薪才行?! 事情是这样的。 Business Insider最近获得了特斯拉内部薪酬数据库(截至202...
阅读原文

o1不是唯一路径!MIT新研究:在测试时训练,模型推理能力最高升至5.8倍

克雷西 发自 凹非寺量子位 | 公众号 QbitAIo1不是通向大模型推理的唯一路径! MIT的新研究发现,在测试时对大模型进行训练,可以让推理水平大幅提升。 在挑战...
阅读原文

开源版SearchGPT来了,两张3090就可复现,超越Perplexity付费版

VSA团队 投稿量子位 | 公众号 QbitAIOpenAI推出SearchGPT没几天,开源版本也来了。 港中文MMLab、上海AI Lab、腾讯团队简易实现了Vision Search Assistant,...
阅读原文

最后4天!2024人工智能年度评选,AI时代的行业先锋就等你来

组委会 发自 凹非寺量子位 | 公众号 QbitAI为了让更多行业者感受技术变革,也为了给予更多同行同路人掌声与鼓舞,我们已启动了2024人工智能年度评选。 今年是...
阅读原文

Caricaturer

Caricaturer是在线AI漫画头像生成器,基于深度学习技术将用户的照片转换成具有夸张和戏剧效果的漫画风格。用户可以上传自己的肖像照片,选择不同的漫画模板,...
阅读原文

backseat ai

backseat ai是专为英雄联盟设计的AI语音辅助工具,提供实时游戏评论和建议,包括购买建议和对线策略,帮助玩家提升游戏技能而不占用过多系统资源。backseat a...
阅读原文

Hertz-Dev

Hertz-Dev是Standard Intelligence推出的开源音频模型,拥有8.5亿参数。Hertz-Dev包括音频自动编码器hertz-codec、音频VAE学习先验hertz-vae和一个66亿参数的...
阅读原文

Stagehand

Stagehand是简单和可扩展的AI网页浏览框架,是Playwright的继承者,提供act、extract和observe三个简单的API,支持自然语言驱动的网页操作。Stagehand提供一...
阅读原文

LobeChat

LobeChat是开源AI聊天框架,支持与多个AI供应商的集成,包括OpenAI、Claude 3、Gemini等。框架包括知识库管理、多模态交互(如视觉识别和文本到语音转换)及...
阅读原文

VideoTuna

VideoTuna是集成多种AI视频生成模型的代码库,支持文本到视频、图像到视频和文本到图像的转换。VideoTuna提供预训练、持续训练、后训练对齐和微调等全面视频...
阅读原文

ComfyUI-MochiEdit

ComfyUI-MochiEdit是基于ComfyUI和Genmo Mochi的开源视频编辑工具,基于将视频转换为噪声、重新采样实现视频编辑,支持局部编辑和视频转视频功能。用户能调整...
阅读原文

HiCo

HiCo是360 AI研究院推出的基于扩散模型的层次化可控布局到图像生成模型,HiCo基于多分支结构设计,实现对对象位置和文本描述的精确控制。HiCo的关键特点在于...
阅读原文

INTUIT

INTUIT是全球领先的财务软件公司,专注于为中小企业、个人和会计专业人士提供全面的财务管理、税务申报和薪资管理解决方案。软件包括如QuickBooks、TurboTax...
阅读原文