DeepSeek-OCR

DeepSeek-OCR 是 DeepSeek 团队推出的视觉语言模型,专注于通过光学压缩技术高效处理长文本内容。模型由 DeepEncoder 编码器和 DeepSeek3B-MoE 解码器组成,...
阅读原文

Dexter

Dexter 是自主金融研究智能代理(Agent),专为处理复杂金融问题而设计。工具能将复杂查询分解为清晰的分步骤研究计划,通过实时市场数据进行分析。
阅读原文

Lyra

Lyra 是创新的AI会议工具,通过AI技术将会议记录、知识管理和团队协作完美融合。工具能记录每一次会议的细节,智能生成行动事项,确保团队成员明确下一步的工...
阅读原文

PaddleOCR-VL

PaddleOCR-VL是百度飞桨团队开源的多模态文档解析模型,参数量仅0.9B,专为低算力设备优化。在国际权威评测OmnidocBench V1.5中以92.6分登顶全球第一,超越GP...
阅读原文

HuggingChat Omni

HuggingChat Omni是Hugging Face最新推出的智能聊天平台,能自动从115个开源模型中匹配最合适的AI模型来回答用户问题。采用Arch-Router-1.5B路由模型技术,根...
阅读原文

Mathpix

Mathpix 是先进的光学字符识别(OCR)工具,专注于将手写或打印的数学公式、化学方程式和表格从图像和PDF文件中提取、转换为可编辑的格式,如LaTeX和Markdown。
阅读原文

Claude Skills

Claude Skills是Anthropic公司为AI助手Claude推出的新型功能,通过文件夹形式封装指令、脚本和资源,让Claude能像人类一样灵活调用专业工具完成特定任务。每...
阅读原文

Coral NPU

Coral NPU 是谷歌推出的全栈开源AI平台,专为低功耗边缘设备(如智能手表、AR 眼镜等)设计,能解决性能、碎片化和隐私三大挑战。Coral NPU基于 RISC-V 指令...
阅读原文

Seekario

Seekario 是专注于提升求职效率的 AI 平台。平台通过智能技术为求职者提供从简历优化到面试准备的全方位支持,帮助用户快速打造专业简历,精准匹配职位需求,...
阅读原文

LongCat-Audio-Codec

LongCat-Audio-Codec 是美团 LongCat 团队开源的语音编解码方案,专为语音大语言模型(Speech LLM)设计。通过语义和声学双 Token 并行提取机制,兼顾语音的...
阅读原文

Manus 1.5

Manus 1.5 是Manus最新推出的强大 AI Agent系统,全面提升任务执行的速度、可靠性和质量。Manus 1.5基于全新架构,任务完成时间从 15 分钟缩短到不到 4 分钟...
阅读原文

Mentorbook

Mentorbook 是 AI 驱动的个性化编程学习平台,帮助用户从编程新手成长为高手。平台通过 AI 技术根据用户的学习目标、水平和风格,定制专属学习路线,涵盖 Pyt...
阅读原文

RTFM

RTFM(Real-Time Frame Model)是李飞飞团队推出的实时生成式世界模型。模型能在单块H100 GPU上运行,实时生成3D场景,支持持久交互。
阅读原文

Percify

Percify 是强大的 AI 数字人生成平台,专注于创建逼真的虚拟形象(avatar)视频内容。用户上传一张人脸图片和音频,通过简单的文字描述,能生成具有自然表情...
阅读原文

UniPixel

UniPixel是香港理工大学和腾讯ARC Lab团队开发的首个统一像素级多模态大模型,专注于图像/视频的精细理解与交互。能在单个模型中完成对象指代、像素级分割和...
阅读原文
178910111,579