标签：图像理解

Mini-LLaVA

Mini-LLaVA是一款轻量级的多模态大语言模型，由清华大学和北京航空航天大学的研究团队联合开发。能处理图像、文本和视频输入，实现高效的多模态数据处理。Min...

2年前 (2024)