AI项目和框架

AutoDocs

AutoDocs 是 TrySita 开发的开源代码文档自动化工具,帮助开发者高效生成和维护代码库文档。通过深度解析代码库的抽象语法树(AST)和构建依赖图,生成准确且...
阅读原文

AnyI2V

AnyI2V 是复旦大学、阿里巴巴达摩院和湖畔实验室联合推出的创新图像动画生成框架。框架无需大量训练数据,能将静态条件图像(如网格、点云等)转化为动态视频...
阅读原文

MiniMax Music 1.5

MiniMax Music 1.5 是先进的 AI 音乐生成模型,支持最长 4 分钟的音乐创作,能根据用户输入的风格、情绪和场景等自然语言描述生成高质量的音乐作品。
阅读原文

K2-Think

K2-Think是阿联酋穆罕默德·本·扎耶德人工智能大学MBZUAI与G42联合推出的开源推理模型,拥有320亿参数,在数学推理、代码生成和科学知识等多领域表现出色,尤...
阅读原文

LMDeploy

LMDeploy 是上海人工智能实验室推出的大模型推理部署工具,能显著提升大模型的推理性能,支持多种硬件架构,包括 NVIDIA 的 Hopper 和 Ampere 系列 GPU,实现...
阅读原文

文心大模型X1.1

文心大模型X1.1是百度推出的深度思考模型,基于迭代式混合强化学习框架,在事实性、指令遵循能力和智能体能力上显著提升,分别提高34.8%、12.5%和9.6%。在权...
阅读原文

SpikingBrain-1.0

SpikingBrain-1.0(瞬悉 1.0)是中国科学院自动化研究所推出的类脑脉冲大模型。模型基于内生复杂性,用新型非Transformer架构,突破Transformer架构在处理超...
阅读原文

混元图像2.1

混元图像2.1(HunyuanImage 2.1)是腾讯推出的开源文生图模型,支持原生2K分辨率,具备强大的复杂语义理解能力,能精准生成场景细节、人物表情和动作。
阅读原文

REFRAG

REFRAG是Meta超级智能实验室推出的针对检索增强生成(RAG)任务的高效解码框架,通过“压缩(Compress)、感知(Sense)、扩展(Expand)”的流程优化大型语言...
阅读原文

XTuner V1

XTuner V1 是上海人工智能实验室开源的新一代大模型训练引擎,基于 PyTorch FSDP 开发,针对超大模型训练中的显存、通信和负载问题进行系统性优化,支持 1T ...
阅读原文

Qwen3-ASR-Flash

Qwen3-ASR-Flash 是通义千问系列最新语音识别模型,基于 Qwen3 基座模型,经海量多模态及 ASR 数据训练而成。模型支持 11 种语言和多种口音,具备高精度、高...
阅读原文

AntSK FileChunk

AntSK FileChunk是基于语义理解的智能文本切片工具,专门用在处理PDF和Word文档。工具基于先进的语义分析技术,将长文档分割成语义完整且连贯的片段,避免传...
阅读原文

AI Video Transcriber

AI Video Transcriber 是开源的视频转录与总结工具,支持YouTube、TikTok等30多个平台。工具用Faster-Whisper进行高精度语音转文字,通过AI优化文本,纠正拼...
阅读原文

DeepDoc

DeepDoc 是开源的深度研究工具,专注于对本地知识库进行深度研究。工具通过研究式工作流,提取本地资源(如 PDF、DOCX、JPG、TXT 等)中的文本,分割存储在向...
阅读原文

Visual Story-Writing

Visual Story-Writing是创新的AI写作工具,通过可视化界面帮助用户构建和编辑故事。工具用GPT-4o技术自动解析文本,能转换成事件、角色和动作的可视化结构,...
阅读原文
156789147