Imagine v0.9
Imagine v0.9 是 xAI 公司推出的最新视频生成模型。模型能在不到20秒内生成6秒左右的视频,支持运动控制、动态相机效果、自然对话添加等功能,且配备语音优先...
OpenAgents
OpenAgents 是用在构建AI Agent网络的开源框架,将Agent连接到网络实现开放式协作。框架通过创建持久化的Agent网络,让Agent能像人类一样长期在线、相互协作...
Sora2提示词指南
OpenAI推出的Sora 2提示词指南,能帮助用户更好地理解如何使用 Sora 2 进行有效的提示和交互。通过提供具体的提示技巧和示例,指导用户如何构建更有效的输入...
Gemini 2.5 Computer Use
Gemini 2.5 Computer Use 是谷歌 DeepMind 推出的基于 Gemini 2.5 的计算机使用模型。模型能让 AI 直接控制浏览器,执行点击、滚动和输入等操作。
CodeFlicker
CodeFlicker是快手推出的AI原生IDE编程工具。支持AI问答和代码自动补全,能理解开发者的问题并提供智能的代码建议。CodeFlicker引入了基于Agent的AI编程,可...
DeepScientist
DeepScientist 是西湖大学等机构提出的自主科研系统,实现从假设生成到实验验证、再到结果分析与论文撰写的全流程自动化。通过多智能体架构与强化学习策略,...
CodeMender
CodeMender是DeepMind推出的是基于 Gemini Deep Think 模型的 AI 代理工具,专注于自动识别和修复软件中的关键安全漏洞。采用被动响应与主动防御相结合的方式...
Ming-UniAudio
Ming-UniAudio 是蚂蚁集团开源的音频多模态模型,统一语音理解、生成和编辑任务。核心是 MingTok-Audio,一个基于 VAE 框架和因果 Transformer 架构的连续语...
Code2Video
Code2Video是新加坡国立大学Show Lab团队开发的AI教学视频生成框架,通过Python代码自动生成高质量教育视频。核心创新在于采用三智能体协作模式:Planner负责...
粤公网安备 44011502001135号