GPT‑5.3‑Codex‑Spark
GPT-5.3-Codex-Spark是OpenAI首个专为实时编程设计的轻量级模型,主打极致速度。模型运行在Cerebras WSE-3晶圆级芯片上,推理速度超1000 tokens/秒,支持128k...
MiniCPM-SALA
MiniCPM-SALA是面壁智能开源的9B端侧大模型,采用创新的SALA(稀疏-线性混合注意力)架构,75%线性注意力负责全局高效建模,用25%稀疏注意力精准捕捉关键信息...
Ming‑Flash‑Omni 2.0
Ming-flash-omni-2.0是蚂蚁集团开源的全模态大模型,采用100B总参数/6B激活参数的MoE架构。作为业界SOTA开源omni-MLLM,模型统一支持图像、视频、音频、文本...
Composer 1.5
Composer 1.5是Cursor推出的自研AI编程模型,通过将强化学习规模扩大20倍训练而成。模型是"思考型"模型,能动态生成思考token推理代码库,支持简单...
HY-1.8B-2Bit
HY-1.8B-2Bit是腾讯混元推出的首个产业级2Bit端侧大模型,模型基于1.8B模型经量化感知训练(QAT)压缩推出。HY-1.8B-2Bit等效参数量仅0.3B,大小仅300MB,内...
Qwen-Image-2.0
Qwen-Image-2.0是阿里通义千问推出的新一代图像生成基础模型,支持文字渲染精准与真实质感细腻两大核心能力。模型支持1k token长指令直出专业信息图、PPT、海...
粤公网安备 44011502001135号