AI项目和框架

EasyAnimate

EasyAnimate是阿里推出的AI视频生成工具,支持文生视频和图生视频两种方式,用户可以上传图片作为视频的起始和结束画面,实现更灵活的视频编辑。EasyAnimate...
阅读原文

EmoTalk3D

EmoTalk3D是华为诺亚方舟实验室、南京大学和复旦大学共同推出的3D数字人框架。技术的核心在于能合成具有丰富情感表达的3D会说话头像。EmoTalk3D能捕捉和再现...
阅读原文

SAM 2

SAM 2(Segment Anything Model 2)是Meta推出的AI对象分割模型,专注于实时图像和视频对象分割。具备零样本泛化能力,能准确分割未知对象,并通过统一架构同...
阅读原文

Wordware

Wordware 是一个集成开发环境(IDE),可以让任何人通过日常语言构建复杂的 AI Agent 和应用。用户无需编程知识,就能利用预构建的工具和模型快速开发个性化...
阅读原文

Qwen2-Math

Qwen2-Math是阿里通义千问推出的基于Qwen2语言模型构建的数学解题专用开源AI模型,专为解决复杂数学问题设计。经过数学专用语料库的预训练和指令微调,表现出...
阅读原文

Aide

Aide 是免费开源的AI 编程插件,具备代码注释、语言转换、智能粘贴、批量处理、变量命名和自定义命令等功能,帮助开发者快速理解、编写和重构代码。Aide 支持...
阅读原文

MaxKB

MaxKB是飞致云推出的开源AI知识库问答系统,提供开箱即用的功能,支持文档上传、在线文档爬取、文本自动拆分和向量化。用户可以快速嵌入MaxKB到第三方业务系...
阅读原文

ExAvatar

ExAvatar是DGIST和Meta公司Codec Avatars Lab联合推出的3D数字形象生成模型,通过简短视频克隆人像并转化为3D数字形象。支持手机扫描快速捕捉全身动作和表情...
阅读原文

Tailor

Tailor是免费开源的AI视频编辑工具,集成了人脸识别、语音识别等智能技术,提供视频编辑、生成和优化三大功能。能实现人脸剪辑、语音剪辑、口播生成、字幕和...
阅读原文

StableDrag

StableDrag是腾讯联合南京大学推出的AI图像编辑框架。让拖拽图片变得既稳又准,就像给图片装上了精准的GPS。无论你想怎么调整,StableDrag都能帮你准确无误地...
阅读原文

La Plateforme

La Plateforme是Mistral AI公司推出AI开发工具,支持用户通过微调来优化AI模型,更好地适应特定的应用场景和数据集。在La Plateforme上用户能够用自己的数据...
阅读原文

智谱AI开放平台

智谱AI开放平台 是一个面向开发者的大模型开发平台。整合了先进的模型能力、丰富的开发资源、自定义知识库及应用体验中心,助力开发者利用GLM大模型的技术潜...

GLM-4-long

GLM-4-long 是智谱AI推出的200万字长文本模型,现已在 智谱AI开放平台 BigModel 上开放API调用。支持超长输入专为处理超长文本和记忆型任务设计,上下文长度...
阅读原文

Qwen2-Audio

Qwen2-Audio是阿里通义千问团队最新推出的开源AI语音模型,支持直接语音输入和多语言文本输出。具备语音聊天、音频分析功能,支持超过8种语言。Qwen2-Audio在...
阅读原文

Imagen 3

Imagen 3是Google推出的AI图像生成模型,可以生成高质量、逼真的图像。Imagen 3对提示词理解更好,可捕捉更多细节,生成更广泛的视觉风格。基于谷歌的文生图...
阅读原文