AI 引擎
Cockpit 开箱支持 5 个 AI 引擎(再加一个 Claude 2 入口,共 6 个 tab 选项)。每个 Agent tab 选一个,可以跨 tab 混用,不用重启 —— 按本地是否有模型、账号在谁那、当前任务哪个最擅长来挑。
| 引擎 | 登录方式 | 何时用 |
|---|---|---|
| Claude | Anthropic claude CLI 登录(或 Claude 2 用第二个账号) | 默认。综合能力最强。 |
| Codex | codex CLI 登录 | 已经有 Codex / GPT 订阅时。 |
| DeepSeek | 在 DeepSeek 选择器里粘 API key | 推理强、便宜。 |
| Kimi | kimi CLI 登录 | 长上下文,国内多用。 |
| Ollama | 不用 —— 本地跑 | 离线、敏感数据、自定义模型。 |
一切都在本地完成。
Overview
一览
| 引擎 | 怎么登录 | 何时用 | 钱付给谁 |
|---|---|---|---|
| Claude | 终端跑一次 claude CLI 登录 | 默认。最强通用模型。 | Anthropic |
| Codex | 终端跑一次 codex CLI 登录 | 已有 Codex / GPT 订阅时。 | OpenAI |
| DeepSeek | 在引擎头部的 DeepSeek 选择器里粘 API key | 推理强、价格低。 | DeepSeek |
| Kimi | 终端跑一次 kimi CLI 登录 | 长上下文,国内主用。 | 月之暗面 |
| Ollama | 不需要 —— 本地 | 离线、敏感数据、自定义模型。 | 没人(你自己的电脑) |
引擎选择器里还有一个 Claude 2 —— 它跟 Claude 是同一个引擎,只是用第二份配置目录(~/.claude2)指向第二个 Anthropic 账号,让你能同时跑两个 Claude tab 走不同账单。配置方式见 Claude 章。
引擎选择怎么工作
每个 Agent tab 头部有引擎选择器。新建 tab 时引擎默认是 Claude。给已有 tab 换引擎会开新会话 —— Claude 历史无法带到 Codex tab,因为每个引擎都有自己的对话格式。
可以同时开比如 5 个 tab:
- Tab 1:Claude 跑
~/code/backend - Tab 2:DeepSeek 跑同项目做便宜的二次意见
- Tab 3:Codex 跑另一个项目
- Tab 4:Kimi 跑笔记本,附一份长 PDF
- Tab 5:Ollama 跑本地模型,离线写草稿
Cockpit 的会话浏览器(侧栏顶部网格图标)能看到全部。
各引擎能做什么
| Claude | Codex | DeepSeek | Kimi | Ollama | |
|---|---|---|---|---|---|
| 能读 & 改你的文件 | ✅ | ✅ | ✅ | ✅ | ⚠️ 看模型 |
| 接受图片附件 | ✅ | ✅ | ✅ | ❌ | ❌ |
| 流式输出(边想边说) | ✅ | ✅ | ✅ | ✅ | ✅ |
| 离线可用 | ❌ | ❌ | ❌ | ❌ | ✅ |
| 多模型变体可选 | 固定(最新版) | 固定 | flash / pro | 固定 | 你拉过的任意模型 |
| UI 里显示实时成本 | ✅ | — | ✅(估算) | — | 免费 |
图片支持是引擎级。Kimi 和 Ollama 收到图片附件会静默丢弃(不报错,但 AI 看不到)。
各引擎接入
每个引擎都有自己的章节。快速指引:
- Claude —— 在终端跑一次
claude按提示登录。Cockpit 自动复用你的 Claude 登录态。 - Codex —— 装 OpenAI 的
codexCLI 并用它登录一次。Cockpit 复用同一份登录态。 - DeepSeek —— 从 platform.deepseek.com 拿 key,在 Agent tab 头部的 DeepSeek 选择器里粘(不是全局 Settings)。然后在同一个选择器里选模型变体。
- Kimi —— 装月之暗面的
kimiCLI 并用它登录一次。Cockpit 复用同一份登录态。 - Ollama —— 装 Ollama 并拉至少一个模型(
ollama pull llama3.1)。新建 Ollama tab 时,模型选择器会列出你拉过的所有模型。
Claude
Claude 是 Cockpit 的默认引擎 —— 启动应用、新开一个 tab,你默认在跟 Claude 聊。Cockpit 不替你管理 Claude 登录,它复用 Anthropic 的 claude CLI,所以你在那边做过的事(订阅、项目设置、MCP 服务器)在 Cockpit 里也都生效。
接入
你需要装好并登录 Anthropic 的 claude CLI。
- 还没装 Claude Code 的话先装:
npm install -g @anthropic-ai/claude-code
- 登录:
claude
claude 命令会引导你完成浏览器登录。登录完成后 Cockpit 自动接管,无需再在 Cockpit 里配置什么。
就这样。打开 Cockpit,新建 Agent tab,开始聊。
你能用到什么
- Anthropic 推荐的最新 Claude 模型,走 Claude Agent SDK。
- 图片附件 —— 粘贴图片到聊天(
Cmd+V),Claude 能看到。PNG / JPEG / WEBP / GIF,每张 5 MB 以内;能附多张。 - 工具调用 —— Claude 能读你的文件、跑 shell 命令、改代码、访问 URL、用 MCP 工具。
- 流式输出 —— 回复一边想一边出。
- UI 里显示成本 —— 每条消息都显示用了多少 token,整个会话的累计 USD 也实时更新。
用第二个 Claude 账号:"Claude 2"
如果你有两个 Anthropic 账号 —— 比如一个个人、一个公司账单 —— Cockpit 允许两个同时用。引擎选择器里会看到两个条目:Claude 和 Claude 2。它们是完全同一个引擎;"Claude 2" 只是把 CLAUDE_CONFIG_DIR 指向 ~/.claude2,让两个 tab 不共用账单。
第二个账号的配置方式:
- 开一个干净的终端,告诉
claude用第二个配置目录:
CLAUDE_CONFIG_DIR=~/.claude2 claude
-
按提示用第二个 Anthropic 账号登录。
-
回到 Cockpit,新开一个 tab 在引擎菜单选 Claude 2。这个 tab 就接到第二个账号了。
可以并排开一个 Claude tab(个人)+ 一个 Claude 2 tab(工作)。Cockpit 分开统计两边的 token 和成本。
路径必须正好是
~/.claude2(代码里硬编码)。改成别的路径 Cockpit 找不到。如果你只有一个 Claude 账号,完全无视 "Claude 2"。
模型切换
Cockpit 始终用 Anthropic 当前推荐的 Claude 模型。没有模型选择器 —— 服务给的最新版你就用最新版。要关注当前是哪个模型,看 Anthropic 的官方公告;官方 SDK 更新时 Cockpit 自动跟进。
常见问题
- 第一条消息就报"未登录"/ 直接出错 —— 在终端跑一次
claude,确认登录走完。Cockpit 只能用claude自己已经能用的那份登录。 - 白天要切账号 —— 走 Claude 2 比登出再登入简单得多。
Codex
如果你有 Codex / ChatGPT 订阅,可以在 Cockpit 里用同一份登录态驱动它。Cockpit 不直接走 OpenAI API —— 这个引擎底下是 spawn('codex', ...) 跑 OpenAI 自己的 codex CLI,然后把它的输出展示给你。
接入
-
装 OpenAI 的
codexCLI(当前安装命令以 OpenAI 官方文档为准,一般一行命令搞定)。 -
登录:
codex
按提示用 OpenAI 账号登录。
- 打开 Cockpit,新建 Agent tab,在引擎菜单选 Codex。这个 tab 就用你的 Codex 登录态了。
Cockpit 里不用粘任何东西 —— Cockpit 复用你机器上 codex 已配置好的状态。
你能用到什么
- CLI 自带的 Codex 模型(没有应用内模型选择器 —— 你装的
codex给你什么就用什么)。 - 图片附件 —— Cockpit 把粘进来的图片落到临时文件,通过
--image参数传给codexCLI。PNG / JPEG / WEBP / GIF 都行。 - 流式回复。
- 工具调用 —— Codex 能读文件、跑 shell 命令、改代码。
- 多 tab 会话 —— 想开几个 Codex tab 就开几个,互相独立。
你拿不到什么
- 不显示实时成本。 Cockpit 无法从
codexCLI 读出计费信息,所以 Codex tab 的 token 条是空的(total_cost_usd: 0)。去 OpenAI 控制台看用量。 - 没有模型选择器。 你的
codexCLI 用哪个模型就用哪个。
常见问题
- "找不到
codex" / 发消息没反应 ——codexCLI 不在 PATH 里。在终端跑codex --version验证;不行的话重装。 - 登录过期 —— 在终端重跑一次
codex走登录流程。Cockpit 不管登录本身。 - CLI 版本旧了 —— OpenAI 定期更新
codex。行为怪怪的话升级一下。
DeepSeek
DeepSeek 是 Cockpit 里最便宜的云端引擎,也是除 Claude 之外唯一能按 tab 选模型变体的。跟 Claude / Codex / Kimi 不同(那些复用 CLI 登录态),DeepSeek 只走 API key —— 在 tab 头部的 DeepSeek 选择器里粘一个 key 就完事。
底层走 DeepSeek 的 Anthropic 兼容端点,通过 Claude Agent SDK 路由请求,所以工具调用、流式、上下文管理跟 Claude 一样。
接入
-
从 platform.deepseek.com 拿一个 API key。形如
sk-...。 -
在 Cockpit 打开一个新 tab、在引擎菜单选 DeepSeek,然后点 tab 头部的 DeepSeek 选择器图标 → 粘 key → 保存(key 存在本地
~/.cockpit/settings.json里,不在 Cockpit 全局 Settings 弹窗里)。 -
同一个选择器里挑模型变体。
完事。key 永远只待在本机。
选模型变体
| 变体 | 何时用 |
|---|---|
deepseek-v4-flash(选择器里默认显示这个) | 快、便宜。适合小修小补、格式化、简单问答。 |
deepseek-v4-pro | 慢、聪明。需要真推理时用 —— 架构决策、难 bug、多步重构。 |
Cockpit 的 Agent SDK 还会用
deepseek-v4-flash做后台小活(标题生成、压缩等),不管你选了哪个变体。
你能用到什么
- 按 tab 在下拉里选
flash或pro。 - 图片附件 ——
Cmd+V粘图片,DeepSeek 能看到(通过 Anthropic 兼容 API)。 - 流式回复。
- 工具调用 —— DeepSeek 能读文件、跑 shell 命令、改代码。
- UI 里显示 token 用量。注意:token 条里的美元数额按 Cockpit 默认单价估算 —— 用作跨会话相对比较有用,实际 DeepSeek 账单去 DeepSeek 控制台看。
常见问题
- "DeepSeek API key is not configured" —— 还没在选择器里粘 key。注意是 tab 头部的 DeepSeek 选择器,不是 Cockpit 的全局 Settings 弹窗。
- "401 / 未授权" —— key 错或失效,回选择器再粘一次,留心别夹空格。
- 回复慢 / 卡 ——
pro本来就比flash慢;不是真的需要推理就换回flash。 - 成本估算涨得比预期快 ——
pro比flash贵好几倍;看 token 条能发现意外用了pro的会话。
Kimi
Kimi 是月之暗面(Moonshot)的中文市场 AI,以长上下文窗口闻名。Cockpit 通过月之暗面的 kimi CLI 驱动它 —— 装一次 CLI、登录一次,Cockpit 接着用。
接入
-
装月之暗面的
kimiCLI(按月之暗面官方安装说明)。 -
登录:
kimi
按提示用 Kimi / 月之暗面账号登录。
- 打开 Cockpit,新建 Agent tab,在引擎菜单选 Kimi。这个 tab 就用你的 Kimi 登录态了。
Cockpit 里不用粘任何东西 —— Cockpit 复用你机器上 kimi 已配置好的状态。
你能用到什么
- CLI 自带的 Kimi 模型。
- 流式回复,模型的"思考"过程会折叠在
<details>块里展示在最终答案之前。 - 工具调用 —— Kimi 能读文件、跑 shell 命令、改代码。
- 多 tab 会话,互相独立。
你拿不到什么
- 没有图片附件。 Kimi tab 不接受图片输入,粘进来的图被静默丢弃。
- 不显示实时成本。 Cockpit 无法从
kimiCLI 读出计费信息。去月之暗面控制台看账单。 - 没有模型选择器。 你的
kimiCLI 自带哪个模型就用哪个。
常见问题
- "找不到
kimi" / 发消息没反应 ——kimiCLI 不在 PATH 里。在终端跑kimi --version验证;不行的话装一下。 - 登录过期 —— 在终端重跑一次
kimi走登录流程。 - CLI 版本旧了 —— 月之暗面定期更新
kimiCLI。行为怪怪的话按月之暗面文档升级。
Ollama
Ollama 是 Cockpit 里唯一全程跑在你自己机器上的引擎。不要 API key,不上云,不按 token 计费。装好 Ollama、拉你要的模型,Cockpit 就在模型选择器里列出来。
什么时候选它:
- 在飞机上或断网。
- 在处理不该离开本机的敏感代码。
- 你有一台强 GPU 工作站,想把它用起来。
- 你在试自定义或微调过的模型。
接入
-
从 ollama.com 装 Ollama。
-
至少拉一个模型:
ollama pull llama3.1
之后可以随时再拉:ollama pull qwen3.5、ollama pull deepseek-coder 等。完整列表见 Ollama 模型库。
-
在 Cockpit 新建 Agent tab,引擎菜单选 Ollama。如果 Ollama 服务没在跑,Cockpit 自动
spawn('ollama', 'serve')启动它,然后最多等 8 秒就绪。 -
点 tab 头部的模型下拉 —— Cockpit 调 Ollama API 拿你拉过的所有模型列出。
你能用到什么
- 你拉过的任意模型,按 tab 选。
- 流式回复。
- 工具调用 (取决于模型 —— 代码微调模型支持工具调用,通用聊天模型常常不支持)。
- 完全离线运行。没有任何出网调用。
- 每条消息零成本。
你拿不到什么
- 没有图片附件。 Cockpit 的 Ollama tab 目前只走文本,即便你拉的是视觉模型。
- 没有"最佳实践"模型选择器。 Ollama 只给你你拉过的 —— Cockpit 不替你选。代码里有一个用于保底的默认模型,但实际使用时你应该自己挑。不确定的话从已知好用的代码模型开始,比如
qwen3.5-coder或deepseek-coder。
怎么选模型
粗略的硬件对应表 —— 实际性能取决于 GPU:
| 你的硬件 | 合理的模型规模 |
|---|---|
| MacBook Air(8 GB 统一内存) | 1B – 3B 模型(很受限,质量低) |
| MacBook Pro M 系列(16–32 GB) | 7B – 13B 模型(日常代码问答够用) |
| Mac Studio / 台式机 64+ GB | 30B+ 模型(媲美较小的云端模型) |
| 24 GB+ 独显工作站 | 70B 模型(接近 Claude Haiku 级质量) |
写代码场景特别推荐看 qwen3-coder、deepseek-coder、codellama 系列。同等规模下比通用聊天模型实用得多。
常见问题
- 下拉里"没有模型" —— 你还没拉过。打开终端跑
ollama pull <名字>至少装一个。 - 回复极慢 —— 模型太大,超出 GPU 舒适承受范围。换个小的。
- 自动启动没起来 —— 在终端手动跑
ollama serve再试。