AI项目和框架

Seed-ASR

Seed-ASR是字节跳动开发的一款基于大型语言模型(LLM)的语音识别(ASR)模型。在超过2000万小时的语音数据和近90万小时的配对ASR数据上训练,支持普通话和13...
阅读原文

Moffee

Moffee是开源的Markdown转PPT工具,支持用户使用Markdown语法快速创建专业的幻灯片。Moffee自动处理布局、分页和样式,支持实时预览和导出为PDF或HTML格式。
阅读原文

浦语灵笔

浦语灵笔IXC-2.5是上海人工智能实验室推出的新一代多模态大模型,具备7B规模的大型语言模型后端。能处理长达96K的长上下文,支持超高分辨率图像和细粒度视频...
阅读原文

新壹视频大模型

新壹视频大模型是新壹科技推出的AI视频创作大模型,自研AI算法和深度学习技术,实现从剧本到成品的一键式创作。具备剧本生成、情感化语音合成、3D元素创建和...
阅读原文

书生·浦语

书生·浦语是上海人工智能实验室推出的开源AI大模型,具有卓越的推理能力和超长文本处理功能。书生·浦语支持高达一百万词元的文本输入,能自主进行网络搜索并...
阅读原文

Half_illustration

Half_illustration是一个基于Flux.1模型的LoRA图像创意模型,融合了摄影写实与插画艺术的元素,创造出独特的视觉效果。这种风格在图像中同时展现了逼真的人物...
阅读原文

ProPainter

ProPainter是南洋理工大学S-Lab团队推出的AI视频修复项目。通过结合双域传播和蒙版引导的稀疏视频Transformer,有效提高了视频修复的性能。ProPainter能自动...
阅读原文

TurboEdit

TurboEdit是Adobe Research 推出的AI即时图像编辑模型。通过编码器迭代反演和基于文本的精细控制,能够在几步内实现对图像的精确编辑。利用详细的文本提示,...
阅读原文

Wav2Lip

Wav2Lip是开源的唇形同步工具,支持用户将音频文件转换成与口型同步的视频,广泛应用于视频编辑和游戏开发等领域。Wav2Lip不仅能够实现实时口型生成,还支持...
阅读原文

AuraFlow

AuraFlow v0.1是Fal团队推出的开源AI文生图模型,拥有6.8B参数量。优化了MMDiT架构,提升了模型的计算效率和可扩展性。AuraFlow擅长精准图像生成,尤其在物体...
阅读原文

LongWriter

LongWriter 是清华大学联合智谱AI推出的长文本生成模型,能生成超10,000字的连贯文本,项目已开源。通过分析现有大型语言模型的输出限制,创建了"LongWr...
阅读原文

源2.0-M32

源2.0-M32是浪潮信息推出的拥有32个专家的混合专家模型(MoE)。采用创新的"Attention Router"技术,提高了模型选择专家的效率和准确性。模型总参数...
阅读原文

Zion

Zion是一个零代码AI应用开发平台,通过可视化配置和拖拽式交互,大幅降低了应用开发的技术门槛。用户无需编程知识即可快速构建小程序、网站等应用。Zion集成...
阅读原文

Dify

Dify是开源的生成式AI应用开发平台,提供从 Agent 构建到 AI workflow 编排、RAG 检索、模型管理等一站式服务。Dify使开发者能专注于创造应用的核心价值,并...
阅读原文

因赛AIGC

因赛AIGC是因赛集团推出的AI营销工具,InsightGPT结合AI技术与营销策略洞察、内容创意生产、传播投放及效果转化,提升营销行业的生产力。InsightGPT不仅具备...
阅读原文