行人、车辆、动物等ReID最新综述!武大等全面总结Transformer方法 | IJCV 2024

原标题:行人、车辆、动物等ReID最新综述!武大等全面总结Transformer方法 | IJCV 2024 文章来源:新智元 内容字数:7928字Transformer在目标重识别 (Re-ID) ...
阅读原文

什么是模式识别(Pattern Recognition)

模式识别(Pattern Recognition)是信息科学和人工智能领域的一个重要分支,对事物或现象的各种形式的信息(数值的、文字的和逻辑关系的)进行处理和分析,实...
阅读原文

VSI-Bench

VSI-Bench(Visual-Spatial Intelligence Benchmark)是李飞飞、谢赛宁及他们的研究团队推出的视觉空间智能基准测试集,研究者构建用在评估多模态大型语言模...
阅读原文

Bamba-9B

Bamba-9B是IBM、普林斯顿大学、卡内基梅隆大学和伊利诺伊大学香槟分校联合推出的,基于Mamba2架构的仅解码语言模型模型。模型在完全开放的数据集上训练,能提...
阅读原文

Univer

Univer是开源的全栈框架,支持创建和编辑电子表格、文档及幻灯片,为用户提供统一且强大的办公解决方案。Univer能在浏览器和Node.js环境中运行,易于集成到各...
阅读原文

Kheish

Kheish是开源的、基于大型语言模型(LLM)的多智能体编排平台,用多个专门的角色(智能体)和灵活的工作流协调复杂任务的各个步骤,如提案生成、审核、验证和...
阅读原文

Doctronic

Doctronic是提供在线AI医生服务的平台,为用户提供快速、免费的初步健康咨询。Doctronic基于一系列问题收集用户的健康信息,帮助诊断症状或讨论健康问题。用...
阅读原文

No more copyright

No more copyright是在线平台,基于AI技术帮助用户将上传的图片转换成独特且无版权问题的版本,专为创意探索和灵感激发而设计。用户上传图像,平台生成新的、...
阅读原文

什么是生成对抗网络(GANs)

生成对抗网络(GANs)是一种深度学习模型,由生成器和判别器两部分组成,通过互相博弈学习达到数据生成的目的。生成器的任务是从随机噪声中生成数据,而判别...
阅读原文

3D-Speaker

3D-Speaker是阿里巴巴通义实验室语音团队推出的多模态开源项目,基于结合声学、语义、视觉信息,实现高精度的说话人识别和语种识别。3D-Speaker提供工业级模...
阅读原文

ERA-42

ERA-42是北京星动纪元推出的端到端原生机器人大模型,与自研的五指灵巧手星动XHAND1结合,能完成100多种复杂灵巧操作任务。ERA-42无需预编程,具备快速学习新...
阅读原文

Baichuan4-Finance

Baichuan4-Finance是百川智能推出的全链路金融领域增强大模型,包括Baichuan4-Finance-Base和Baichuan4-Finance。基于Baichuan4-Turbo,用领域自约束训练,在...
阅读原文

十四届全国人大会专题讲座第十讲讲稿

委员长、各位副委员长、秘书长、各位委员:人工智能领域近年来正在迎来一场由生成式人工智能大模型引领的爆发式发展。2022年11月30日,OpenAI公司推出一款人...
阅读原文

OpenAI的o3模型消耗惊人:每一次任务执行消耗的能源相当于五箱油

原标题:OpenAI的o3模型消耗惊人:每一次任务执行消耗的能源相当于五箱油 文章来源:小夏聊AIGC 内容字数:1613字人工智能的双刃剑:强大的模型与可持续发展...
阅读原文

图像超分辨率技术迎来重大突破!InvSR工具实现模糊照片一键变高清

原标题:图像超分辨率技术迎来重大突破!InvSR工具实现模糊照片一键变高清 文章来源:小夏聊AIGC 内容字数:1746字让模糊照片重获新生:InvSR图像超分辨率工...
阅读原文