MiniCPM5-1B - 随身AI智能助手 擅长工具使用和复杂推理,长上下文处理能力强 一键整合包下载
MiniCPM5-1B 是一款由 OpenBMB 团队开发的1B参数约10亿小型语言模型属于 MiniCPM5 系列的第一个版本。外号“面壁小钢炮”简单说它就是一个体积小、能力强、适合本地运行的 AI 助手。MiniCPM5-1B 就是目前最强的小模型之一专为“本地跑、不想依赖云端”的人设计在体积和能力之间找到了很好的平衡特别适合个人开发者、隐私场景和资源受限的环境。主要特点超级小巧省资源只有1B参数能轻松跑在手机、笔记本、边缘设备甚至普通电脑上不需要高端显卡。1B级别最强SOTA在同等大小的开源模型里整体能力最优秀尤其在工具调用Agent、代码生成、复杂推理上表现突出。混合思考模式同一个模型可以“快速回答”或“慢慢思考”。通过 enable_thinking 开关切换想快就快想严谨就让它一步步推理类似 think 标签。超长上下文支持 131072 tokens约10万字能一次性处理很长的文档、代码库或对话历史。好部署基于标准 Llama 架构兼容 vLLM、SGLang、Ollama、llama.cpp、LM Studio 等主流工具还有 GGUF、MLX 等量化版本手机/电脑本地跑都很方便。支持工具调用能很好地调用外部工具、函数适合做智能 Agent。应用领域本地私人助手手机、电脑上跑的离线 AI 聊天、问答隐私好、不联网。代码助手 / 编程 Agent写代码、调试、理解代码仓库特别适合开发者本地使用。工具使用场景能调用 API、操作工具的多步任务比如自动处理工作流。长文档处理分析长 PDF、报告、书籍或做长上下文推理。边缘计算 / 设备端 AI资源有限的设备上运行智能功能如机器人、IoT、智能硬件。桌面宠物 / 趣味应用官方还做了用它驱动的本地桌面小宠物交互很有趣。使用教程建议N卡显存4G起支持50系显卡支持思考/非思考两种模式输入问题或需求提交即可。支持消费级笔记本流畅运行实测4G显存8G运存流畅运行。支持WebUI和GUI两种运行模式支持api可对接三方Agent使用启动后 API 地址为http://localhost:8000兼容open-ai 格式api请求参数{ model: minicpm5-1b, messages: [ {role: system, content: You are a helpful assistant.}, {role: user, content: 你好} ], temperature: 0.9, top_p: 0.95, max_tokens: 4096, stream: false, thinking_mode: true }crul格式curl http://localhost:8000/v1/chat/completions \ -H Content-Type: application/json \ -d { model: minicpm5-1b, messages: [ {role: user, content: 用Python写一个计算器} ], temperature: 0.7, stream: false }下载地址点此下载