AI项目和框架

RelightVid

RelightVid是上海 AI Lab、复旦大学、上海交通大学、浙江大学、斯坦福大学和香港中文大学推出用在视频重照明的时序一致性扩散模型,支持根据文本提示、背景视...
阅读原文

HRAvatar

HRAvatar是清华大学联合IDEA团队推出的单目视频重建技术,支持从普通单目视频中生成高质量、可重光照的3D头像。HRAvatar用可学习的形变基和线性蒙皮技术,基...
阅读原文

Pocket Flow

Pocket Flow 是极简的 LLM(大型语言模型)框架,仅用 100 行代码实现,具有轻量级、无依赖、无厂商锁定的特点。Pocket Flow支持多Agents、工作流、检索增强...
阅读原文

ScrapeGraphAI

ScrapeGraphAI 是基于大型语言模型(LLM)驱动的智能网络爬虫工具包,专注于从各类网站和HTML内容中高效提取结构化数据。具备三大核心功能:SmartScraper可根...
阅读原文

Claude 4

Claude 4 是 Anthropic 公司推出的新一代 AI 模型,包括 Claude Opus 4 和 Claude Sonnet 4。Opus 4 是目前全球最强的编程模型,擅长复杂任务和长时间运行的...
阅读原文

Joy industrial

Joy Industrial是京东工业推出的行业首个供应链为核心的工业大模型。模型针对工业场景,依托京东工业在工业数智供应链领域的经验积累和数据沉淀,基于“工业大...
阅读原文

DMind

DMind是DMind研究机构发布的专为Web3领域优化的大型语言模型。针对区块链、去中心化金融和智能合约等场景深度优化,使用Web3数据微调采用RLHF技术对齐。
阅读原文

MoviiGen 1.1

MoviiGen 1.1 是ZulutionAI推出的专注于生成电影级画质视频的AI模型。模型基于 Wan2.1 微调而成,经过专业电影制作人和AIGC创作者在60个美学维度上的评估,表...
阅读原文

Devstral

Devstral是Mistral AI和All Hands AI推出的专为软件工程任务设计的编程专用模型。Devstral在解决真实世界软件问题上表现出色,在SWE-Bench Verified基准测试...
阅读原文

MMaDA

MMaDA(Multimodal Large Diffusion Language Models)是普林斯顿大学、清华大学、北京大学和字节跳动推出的多模态扩散模型,支持跨文本推理、多模态理解和文...
阅读原文

Context7

Context7 是 Upstash 推出的AI工具,为大型语言模型(LLMs)和 AI 代码编辑器提供最新、版本特定的文档和代码片段。通过解析文档、丰富内容、向量化和重新排...
阅读原文

MedGemma

MedGemma是谷歌推出的开源AI模型,专门用在医疗图像与文本分析。模型基于Gemma 3架构,包含4B参数的多模态模型和27B参数的纯文本模型。4B模型擅长解读医疗图...
阅读原文

BAGEL

BAGEL是字节跳动开源的多模态基础模型,拥有140亿参数,其中70亿为活跃参数。采用混合变换器专家架构(MoT),通过两个独立编码器分别捕捉图像的像素级和语义...
阅读原文

Gemma 3n

Gemma 3n 是谷歌 I/O 开发者大会推出的端侧多模态 AI 模型。基于 Gemini Nano 架构,采用逐层嵌入技术,将内存占用压缩至 2-4B 参数模型水平。模型参数量分别...
阅读原文

News Agents

News Agents基于终端的新闻聚合与摘要系统。基于Amazon Q CLI作为 Agent 框架,用Model Context Protocol (MCP)解析RSS新闻源,借助tmux实现终端分割和多任...
阅读原文
12829303132147