JoyCaption

JoyCaption 是开源的图像提示词生成工具,用于训练扩散模型。JoyCaption 涵盖广泛的图像风格、内容、种族、性别和取向,最小化过滤理解世界的各个方面,但不...
阅读原文

麦橘超然

麦橘超然(MajicFlus)是由麦橘推出的基于Flux.1架构的AI模型,专注于生成高质量的人像图像,擅长表现亚洲女性的细腻与美感。模型融合多种技术,能生成逼真的...
阅读原文

Retake AI

Retake AI是AI照片编辑和修复工具,专为提升照片质量而设计。通过人工智能技术,提供多种功能,包括超分辨率放大、低清人像修复、超级降噪、低光照增强和人像...
阅读原文

CHRONOS

CHRONOS是上海交通大学计算机科学与工程系、阿里巴巴集团通义实验室等机构联合推出的,用在新闻时间线摘要生成的新型框架,基于迭代自问自答的方式,用大型语...
阅读原文

Project DIGITS

Project DIGITS 是 NVIDIA 推出的个人 AI 超级计算机,能为 AI 研究人员、数据科学家和学生提供强大的计算能力。Project DIGITS基于 NVIDIA Grace Blackwell ...
阅读原文

Edicho

Edicho 是香港科技大学、蚂蚁集团、斯坦福大学和香港中文大学推出的,基于扩散模型的图像编辑方法,能在多图像间实现一致性编辑。Edicho用免训练的方法,无需...
阅读原文

Mobile-Agent

Mobile-Agent 是具有移动性的智能代理软件实体,能在网络的各个节点之间移动,代表用户或其他代理进行工作。能根据具体情况中断当前执行,移动至另一设备上恢...
阅读原文

VideoRAG

VideoRAG是用于长视频理解的检索增强生成(Retrieval-Augmented Generation)技术。通过提取视频中的视觉对齐辅助文本,帮助大型视频语言模型(LVLMs)更好地...
阅读原文

轻创AI论文写作

轻创AI论文写作是创新的人工智能写作工具,旨在帮助用户高效地完成论文写作任务。通过先进的深度学习算法和大数据分析技术,能根据用户提供的主题和关键词,...
阅读原文

SPRIGHT

SPRIGHT(SPatially RIGHT)是亚利桑那州立大学 、Intel 实验室 、Hugging Face 、华盛顿大学等机构联合推出的,专注于空间关系的大型视觉-语言数据集,能解...
阅读原文

LIGER

LIGER是Meta AI等机构推出的混合检索模型,结合生成式检索和密集检索的优点。LIGER用生成式检索模块生成有限的候选项目集,基于密集检索对候选项目进行排序和...
阅读原文

SeedVR

SeedVR是南洋理工大学和字节跳动推出的扩散变换器模型,能实现高质量的通用视频修复。SeedVR基于引入移位窗口注意力机制,采用大尺寸(64×64)窗口和边界处的...
阅读原文

纯视觉方案,精准操控电脑和手机!港大Aria-UI登顶,超越Claude 3.5

原标题:纯视觉方案,精准操控电脑和手机!港大Aria-UI登顶,超越Claude 3.5 文章来源:新智元 内容字数:13458字Aria-UI:纯视觉GUI智能交互的革命性突破 ...
阅读原文

OpenAI智能体曝本月诞生!比谷歌Anthropic慢,竟是担心prompt攻击

原标题:OpenAI智能体曝本月诞生!比谷歌Anthropic慢,竟是担心prompt攻击 文章来源:新智元 内容字数:3288字OpenAI智能体发布延迟:安全问题成最大阻碍 Op...
阅读原文