AI项目和框架

日日新融合大模型

“日日新”融合大模型（SenseNova）是商汤科技于2025年1月10日正式推出的多模态大模型。模型实现了原生融合模态，深度推理能力与多模态信息处理能力均大幅提升...

阅读原文

AI工具

9个月前

Agent Laboratory

Agent Laboratory是AMD和约翰·霍普金斯大学推出，基于大型语言模型（LLM）的自主研究框架，能加速科学发现、降低成本并提高研究质量。Agent Laboratory接受人...

AI工具

9个月前

Hallo3

Hallo3是复旦大学和百度公司联合推出的，基于扩散变换器网络（Diffusion Transformer Networks）的肖像图像动画技术，能生成高度动态和逼真的视频。Hallo3基...

阅读原文

AI工具

9个月前

rStar-Math

rStar-Math是微软亚洲研究院推出的创新研究项目，基于蒙特卡洛树搜索（MCTS）驱动的深度思考，使小型语言模型（SLMs）在数学推理方面达到甚至超越OpenAI大型...

阅读原文

AI工具

9个月前

Seer

Seer是由上海AI实验室、北京大学计算机科学与技术学院、北京大学软件与微电子学院等机构联合推出的端到端操作模型，实现机器人视觉预测与动作执行的高度协同...

阅读原文

AI工具

9个月前

ArtCrafter

ArtCrafter是清华大学、鹏城实验室和联想研究院共同推出的文本到图像风格迁移框架，基于扩散模型，解决传统方法在风格表达、内容一致性和输出多样性方面的局...

阅读原文

AI工具

9个月前

Ingredients

Ingredients是强大的框架，基于将多个特定身份（ID）照片与视频扩散Transformer相结合，用在定制视频创作。Ingredients基于三个核心模块实现高度定制化的视频...

阅读原文

AI工具

9个月前

MultiBooth

MultiBooth是清华大学深圳国际研究生院、 Meta、香港科技大学等机构推出的多概念图像生成方法，能从文本中生成包含多个用户指定概念的图像。MultiBooth将生成...

阅读原文

AI工具

9个月前

Aria-UI

Aria-UI是香港大学和Rhymes AI共同推出的为图形用户界面（GUI）定位任务设计的大型多模态模型。基于纯视觉方法，不依赖于HTML或AXTree等辅助输入，用大规模、...

阅读原文

AI工具

9个月前

TransPixar

TransPixar是香港中文大学、Adobe研究院、香港科技大学和智能摩尔联合开源的，先进的文本到视频生成方法，扩展预训练的RGB视频模型生成包含透明度信息的RGBA...

阅读原文

AI工具

9个月前

星火人设

星火人设是科大讯飞推出的专为情感交互而设计的独立模型（角色模拟API），具备人物设定、剧情演绎与语言风格等控制选项，支持模型精调。在规模C端用户的双盲...

阅读原文

AI工具

9个月前

万相2.1

万相2.1是阿里推出的通义万相升级版本。基于自研的高效VAE和DiT架构，增强时空上下文建模能力，支持无限长1080P视频的高效编解码，首次实现中文文字视频生成...

阅读原文

AI工具

9个月前

星火纪要

星火纪要是科大讯飞推出的集转录、总结、翻译、分析为一体的音视频处理平台，广泛应用于通用会议、访谈、销售、培训等场景。能帮助个人高效总结会议重点内容...

阅读原文

AI工具

9个月前

AutoDroid-V2

AutoDroid-V2是清华大学人工智能产业研究院推出的基于小型语言模型（SLM）的移动端GUI自动化脚本代理，能基于代码生成技术提升设备上的GUI代理性能。AutoDroi...

阅读原文

AI工具

9个月前

EnerVerse

EnerVerse 是智元机器人团队开发的首个机器人4D世界模型，旨在通过生成未来具身空间来指导机器人完成复杂任务。模型采用自回归扩散模型，结合稀疏记忆机制（S...

阅读原文

AI工具

9个月前

1…74 757677 78…148