AI项目和框架

YuLan-OneSim

YuLan-OneSim(玉兰-万象)是中国人民大学高瓴 AI 学院RUC-GSAI团队推出的新型社会模拟器。基于大型语言模型(LLM)Agents 模拟人类社会行为,无需编程构建模...
阅读原文

WorldPM

WorldPM(World Preference Modeling)是阿里巴巴集团的Qwen团队和复旦大学推出的偏好建模模型系列。基于大规模训练揭示偏好模型的可扩展性。模型基于1500万...
阅读原文

SketchVideo

SketchVideo 是中国科学院大学,香港科技大学和快手可灵团队推出的基于草图的视频生成与编辑框架。在关键帧上绘制草图,结合文本提示,实现对视频的空间布局...
阅读原文

AniSora

AniSora 是哔哩哔哩开源的先进动漫视频生成模型,模型支持一键生成多种动漫风格的视频,涵盖番剧片段、国创动画、VTuber 内容等。模型包含超过 1000 万高质量...
阅读原文

LightLab

LightLab是谷歌等机构推出的基于扩散模型的图像光源控制模型,能对单张图像中的光源进行细粒度的参数化控制。支持用户调整光源的强度和颜色,插入虚拟光源,...
阅读原文

BLIP3-o

BLIP3-o是Salesforce Research等机构推出的创新多模态模型,融合自回归模型的推理和指令遵循能力及扩散模型的强大生成能力。模型基于扩散语义丰富的CLIP图像...
阅读原文

ShotAdapter

ShotAdapter是Adobe联合UIUC推出的用在文本到多镜头视频生成的框架,基于微调预训练的文本到视频模型,引入过渡标记和局部注意力掩码策略,实现对多镜头视频...
阅读原文

Pemo

Pemo是AI驱动的文档管理工具。工具支持PDF、Epub、Word等多种格式文档的导入与管理,具备一键翻译、智能总结、思维导图生成等功能,帮助用户快速理解复杂文献...
阅读原文

OpenMemory MCP

OpenMemory MCP 是mem0推出的基于开放模型上下文协议(MCP)构建的开源工具,能解决 AI 工具记忆痛点,实现不同工具间共享上下文信息。OpenMemory MCP支持 10...
阅读原文

Toolkami

Toolkami 是极简的 AI Agent 框架,用七种工具支持运行, 包括读(Read)、写(Write Diff)、浏览(Browse)、命令(Command)、提问(Ask)、思考(Think)。框架支持 T...
阅读原文

SWE-1

SWE-1是Windsurf团队推出的首个软件工程 AI 模型系列,专为整个软件开发流程优化,涵盖代码生成、测试、调试、资料查找等开发环节,提升开发效率和用户体验。
阅读原文

DICE-Talk

DICE-Talk是复旦大学联合腾讯优图实验室推出的新颖情感化动态肖像生成框架,支持生成具有生动情感表达且保持身份一致性的动态肖像视频。DICE-Talk引入情感关...
阅读原文

混元图像2.0

混元图像2.0(Hunyuan Image 2.0)是腾讯推出的业内首个毫秒级响应的实时生图大模型。混元图像2.0支持文本、语音、草图等多种交互方式,用户输入指令后,图像...
阅读原文

Paper2Coder

Paper2Coder 是韩国科学技术院推出的多智能体大语言模型(LLM)系统,支持将机器学习领域的科学论文自动转换为代码库。基于规划、分析和代码生成三个阶段,将...
阅读原文

Sketch2Anim

Sketch2Anim 是爱丁堡大学联合Snap Research、东北大学推出的自动化框架,能将2D草图故事板直接转换为高质量的3D动画。基于条件运动合成技术,用3D关键姿势、...
阅读原文
13031323334147