Imagine v0.9

Imagine v0.9 是 xAI 公司推出的最新视频生成模型。模型能在不到20秒内生成6秒左右的视频,支持运动控制、动态相机效果、自然对话添加等功能,且配备语音优先...
阅读原文

OpenAgents

OpenAgents 是用在构建AI Agent网络的开源框架,将Agent连接到网络实现开放式协作。框架通过创建持久化的Agent网络,让Agent能像人类一样长期在线、相互协作...
阅读原文

Sora2提示词指南

OpenAI推出的Sora 2提示词指南,能帮助用户更好地理解如何使用 Sora 2 进行有效的提示和交互。通过提供具体的提示技巧和示例,指导用户如何构建更有效的输入...
阅读原文

Ling-1T

Ling-1T 是蚂蚁集团开源的万亿参数语言模型,定位为“旗舰级非思考模型”。基于 MoE(Mixture of Experts)架构,拥有 1 万亿参数,每次推理激活约 510 亿参数...
阅读原文

Gemini 2.5 Computer Use

Gemini 2.5 Computer Use 是谷歌 DeepMind 推出的基于 Gemini 2.5 的计算机使用模型。模型能让 AI 直接控制浏览器,执行点击、滚动和输入等操作。
阅读原文

CodeFlicker

CodeFlicker是快手推出的AI原生IDE编程工具。支持AI问答和代码自动补全,能理解开发者的问题并提供智能的代码建议。CodeFlicker引入了基于Agent的AI编程,可...
阅读原文

DeepScientist

DeepScientist 是西湖大学等机构提出的自主科研系统,实现从假设生成到实验验证、再到结果分析与论文撰写的全流程自动化。通过多智能体架构与强化学习策略,...
阅读原文

CodeMender

CodeMender是DeepMind推出的是基于 Gemini Deep Think 模型的 AI 代理工具,专注于自动识别和修复软件中的关键安全漏洞。采用被动响应与主动防御相结合的方式...
阅读原文

NatAgent

NatAgent 是基于自然语言的 AI 数据情报监控与分析平台,专注于通过智能化技术帮助用户高效提取、监控和分析各类网络数据,从中获取可操作的洞察。核心功能包...
阅读原文

Juicebox

Juicebox 是领先的AI招聘平台,通过AI技术优化招聘流程。平台能从海量数据中自动筛选出符合条件的候选人,通过智能算法精准匹配岗位需求。
阅读原文

SceneGen

SceneGen是上海交通大学研究团队开发的高效开源3D场景生成框架。能从单张场景图像及其对应的物体分割掩码出发,通过一次前向传播,直接生成包含完整几何结构...
阅读原文

Auralix

Auralix 是创新的 AI 语音辅导工具,通过实时语音互动帮助用户高效学习。工具支持将学习材料转化为清晰的笔记,通过 AI 教练进行一对一的语音辅导,支持打断...
阅读原文

Ming-UniAudio

Ming-UniAudio 是蚂蚁集团开源的音频多模态模型,统一语音理解、生成和编辑任务。核心是 MingTok-Audio,一个基于 VAE 框架和因果 Transformer 架构的连续语...
阅读原文

Agent Kit

Agent Kit 是 OpenAI 推出的一套完整的智能体开发工具包,帮助开发者将 AI 代理从原型快速推进至生产环境。包含三大核心组件:Agent Builder可视化画布工具,...
阅读原文

Code2Video

Code2Video是新加坡国立大学Show Lab团队开发的AI教学视频生成框架,通过Python代码自动生成高质量教育视频。核心创新在于采用三智能体协作模式:Planner负责...
阅读原文