LLaVA-OneVision-1.5
LLaVA-OneVision-1.5 是开源的多模态模型,通过高效训练和高质量数据实现高性能、低成本和强复现性。采用自研的 RICE-ViT 作为视觉编码器,结合 2D 旋转位置...
MineContext
MineContext 是字节跳动开源的主动式上下文感知 AI 工具,通过挖掘数字生活中的“方块”,帮助用户高效管理知识和信息。每 5 秒截取一次屏幕,经过处理后,批量...
NeuTTS Air
NeuTTS Air 是 Neuphonic 开发的超拟真、可离线运行的 TTS(文本到语音)模型。具备高拟真语音合成能力,声音自然流畅,几乎能以假乱真。支持本地运行,提供 ...
AladdinEdu
AladdinEdu 是九章云极旗下面向高校科研场景的高性能 GPU 算力服务平台。平台提供多种套餐,支持 DC100(Hopper)显卡,具备大显存和高算力,适合大模型训练。
Agentic Context Engineering(ACE)是什么?
Agentic Context Engineering(ACE)是斯坦福大学、SambaNova Systems和加州大学伯克利分校的研究者们提出的创新框架,通过动态优化输入信息(即“上下文”)来...
Paper2Video
Paper2Video 是新加坡国立大学 Show Lab 开发的项目,从学术论文自动生成演示视频。通过 PaperTalker 多智能体框架,将论文转化为包含幻灯片、字幕、语音和演...
Qwen3-VL Cookbooks
Qwen3-VL Cookbooks 是阿里推出的为 Qwen3-VL 模型设计的实用指南集合,帮助用户快速掌握和应用该模型的各种功能。集合涵盖多种能力的使用示例,包括物体识别...
Androidify
Androidify 是谷歌推出的一个开源项目,帮助开发者学习如何在 Android 上构建 AI 驱动的应用。项目使用了谷歌最新的技术,如 Jetpack Compose、Gemini API(...
Jamba Reasoning 3B
Jamba Reasoning 3B 是 AI21 Labs 推出的轻量级高效推理模型,拥有 30 亿参数和 256K 的超长上下文处理能力。模型用混合 Transformer-Mamba 架构,结合注意力...
Gemini Enterprise
Gemini Enterprise 是 Google Cloud 推出的企业级 AI 平台,通过直观的聊天界面将 Google 顶尖的 AI 技术融入企业工作流程。平台能连接企业所有数据、工具和...
粤公网安备 44011502001135号