OpenCockpitOpenCockpit
Agent 面板

AI 引擎

Cockpit 开箱支持 5 个 AI 引擎(再加一个 Claude 2 入口,共 6 个 tab 选项)。每个 Agent tab 选一个,可以跨 tab 混用,不用重启 —— 按本地是否有模型、账号在谁那、当前任务哪个最擅长来挑。

引擎登录方式何时用
ClaudeAnthropic claude CLI 登录(或 Claude 2 用第二个账号)默认。综合能力最强。
Codexcodex CLI 登录已经有 Codex / GPT 订阅时。
DeepSeek在 DeepSeek 选择器里粘 API key推理强、便宜。
Kimikimi CLI 登录长上下文,国内多用。
Ollama不用 —— 本地跑离线、敏感数据、自定义模型。

一切都在本地完成。

Overview

一览

引擎怎么登录何时用钱付给谁
Claude终端跑一次 claude CLI 登录默认。最强通用模型。Anthropic
Codex终端跑一次 codex CLI 登录已有 Codex / GPT 订阅时。OpenAI
DeepSeek在引擎头部的 DeepSeek 选择器里粘 API key推理强、价格低。DeepSeek
Kimi终端跑一次 kimi CLI 登录长上下文,国内主用。月之暗面
Ollama不需要 —— 本地离线、敏感数据、自定义模型。没人(你自己的电脑)

引擎选择器里还有一个 Claude 2 —— 它跟 Claude 是同一个引擎,只是用第二份配置目录(~/.claude2)指向第二个 Anthropic 账号,让你能同时跑两个 Claude tab 走不同账单。配置方式见 Claude 章。

引擎选择怎么工作

每个 Agent tab 头部有引擎选择器。新建 tab 时引擎默认是 Claude。给已有 tab 换引擎会开新会话 —— Claude 历史无法带到 Codex tab,因为每个引擎都有自己的对话格式。

可以同时开比如 5 个 tab:

  • Tab 1:Claude 跑 ~/code/backend
  • Tab 2:DeepSeek 跑同项目做便宜的二次意见
  • Tab 3:Codex 跑另一个项目
  • Tab 4:Kimi 跑笔记本,附一份长 PDF
  • Tab 5:Ollama 跑本地模型,离线写草稿

Cockpit 的会话浏览器(侧栏顶部网格图标)能看到全部。

各引擎能做什么

ClaudeCodexDeepSeekKimiOllama
能读 & 改你的文件⚠️ 看模型
接受图片附件
流式输出(边想边说)
离线可用
多模型变体可选固定(最新版)固定flash / pro固定你拉过的任意模型
UI 里显示实时成本✅(估算)免费

图片支持是引擎级。KimiOllama 收到图片附件会静默丢弃(不报错,但 AI 看不到)。

各引擎接入

每个引擎都有自己的章节。快速指引:

  • Claude —— 在终端跑一次 claude 按提示登录。Cockpit 自动复用你的 Claude 登录态。
  • Codex —— 装 OpenAI 的 codex CLI 并用它登录一次。Cockpit 复用同一份登录态。
  • DeepSeek —— 从 platform.deepseek.com 拿 key,在 Agent tab 头部的 DeepSeek 选择器里粘(不是全局 Settings)。然后在同一个选择器里选模型变体。
  • Kimi —— 装月之暗面的 kimi CLI 并用它登录一次。Cockpit 复用同一份登录态。
  • Ollama —— 装 Ollama 并拉至少一个模型(ollama pull llama3.1)。新建 Ollama tab 时,模型选择器会列出你拉过的所有模型。

Claude

Claude 是 Cockpit 的默认引擎 —— 启动应用、新开一个 tab,你默认在跟 Claude 聊。Cockpit 不替你管理 Claude 登录,它复用 Anthropic 的 claude CLI,所以你在那边做过的事(订阅、项目设置、MCP 服务器)在 Cockpit 里也都生效。

接入

你需要装好并登录 Anthropic 的 claude CLI。

  1. 还没装 Claude Code 的话先装:
npm install -g @anthropic-ai/claude-code
  1. 登录:
claude

claude 命令会引导你完成浏览器登录。登录完成后 Cockpit 自动接管,无需再在 Cockpit 里配置什么。

就这样。打开 Cockpit,新建 Agent tab,开始聊。

你能用到什么

  • Anthropic 推荐的最新 Claude 模型,走 Claude Agent SDK。
  • 图片附件 —— 粘贴图片到聊天(Cmd+V),Claude 能看到。PNG / JPEG / WEBP / GIF,每张 5 MB 以内;能附多张。
  • 工具调用 —— Claude 能读你的文件、跑 shell 命令、改代码、访问 URL、用 MCP 工具。
  • 流式输出 —— 回复一边想一边出。
  • UI 里显示成本 —— 每条消息都显示用了多少 token,整个会话的累计 USD 也实时更新。

用第二个 Claude 账号:"Claude 2"

如果你有两个 Anthropic 账号 —— 比如一个个人、一个公司账单 —— Cockpit 允许两个同时用。引擎选择器里会看到两个条目:ClaudeClaude 2。它们是完全同一个引擎;"Claude 2" 只是把 CLAUDE_CONFIG_DIR 指向 ~/.claude2,让两个 tab 不共用账单。

第二个账号的配置方式:

  1. 开一个干净的终端,告诉 claude 用第二个配置目录:
CLAUDE_CONFIG_DIR=~/.claude2 claude
  1. 按提示用第二个 Anthropic 账号登录。

  2. 回到 Cockpit,新开一个 tab 在引擎菜单选 Claude 2。这个 tab 就接到第二个账号了。

可以并排开一个 Claude tab(个人)+ 一个 Claude 2 tab(工作)。Cockpit 分开统计两边的 token 和成本。

路径必须正好~/.claude2(代码里硬编码)。改成别的路径 Cockpit 找不到。如果你只有一个 Claude 账号,完全无视 "Claude 2"。

模型切换

Cockpit 始终用 Anthropic 当前推荐的 Claude 模型。没有模型选择器 —— 服务给的最新版你就用最新版。要关注当前是哪个模型,看 Anthropic 的官方公告;官方 SDK 更新时 Cockpit 自动跟进。

常见问题

  • 第一条消息就报"未登录"/ 直接出错 —— 在终端跑一次 claude,确认登录走完。Cockpit 只能用 claude 自己已经能用的那份登录。
  • 白天要切账号 —— 走 Claude 2 比登出再登入简单得多。

Codex

如果你有 Codex / ChatGPT 订阅,可以在 Cockpit 里用同一份登录态驱动它。Cockpit 不直接走 OpenAI API —— 这个引擎底下是 spawn('codex', ...) 跑 OpenAI 自己的 codex CLI,然后把它的输出展示给你。

接入

  1. 装 OpenAI 的 codex CLI(当前安装命令以 OpenAI 官方文档为准,一般一行命令搞定)。

  2. 登录:

codex

按提示用 OpenAI 账号登录。

  1. 打开 Cockpit,新建 Agent tab,在引擎菜单选 Codex。这个 tab 就用你的 Codex 登录态了。

Cockpit 里不用粘任何东西 —— Cockpit 复用你机器上 codex 已配置好的状态。

你能用到什么

  • CLI 自带的 Codex 模型(没有应用内模型选择器 —— 你装的 codex 给你什么就用什么)。
  • 图片附件 —— Cockpit 把粘进来的图片落到临时文件,通过 --image 参数传给 codex CLI。PNG / JPEG / WEBP / GIF 都行。
  • 流式回复。
  • 工具调用 —— Codex 能读文件、跑 shell 命令、改代码。
  • 多 tab 会话 —— 想开几个 Codex tab 就开几个,互相独立。

你拿不到什么

  • 不显示实时成本。 Cockpit 无法从 codex CLI 读出计费信息,所以 Codex tab 的 token 条是空的(total_cost_usd: 0)。去 OpenAI 控制台看用量。
  • 没有模型选择器。 你的 codex CLI 用哪个模型就用哪个。

常见问题

  • "找不到 codex" / 发消息没反应 —— codex CLI 不在 PATH 里。在终端跑 codex --version 验证;不行的话重装。
  • 登录过期 —— 在终端重跑一次 codex 走登录流程。Cockpit 不管登录本身。
  • CLI 版本旧了 —— OpenAI 定期更新 codex。行为怪怪的话升级一下。

DeepSeek

DeepSeek 是 Cockpit 里最便宜的云端引擎,也是除 Claude 之外唯一能按 tab 选模型变体的。跟 Claude / Codex / Kimi 不同(那些复用 CLI 登录态),DeepSeek 只走 API key —— 在 tab 头部的 DeepSeek 选择器里粘一个 key 就完事。

底层走 DeepSeek 的 Anthropic 兼容端点,通过 Claude Agent SDK 路由请求,所以工具调用、流式、上下文管理跟 Claude 一样。

接入

  1. platform.deepseek.com 拿一个 API key。形如 sk-...

  2. 在 Cockpit 打开一个新 tab、在引擎菜单选 DeepSeek,然后点 tab 头部的 DeepSeek 选择器图标 → 粘 key → 保存(key 存在本地 ~/.cockpit/settings.json 里,不在 Cockpit 全局 Settings 弹窗里)。

  3. 同一个选择器里挑模型变体。

完事。key 永远只待在本机。

选模型变体

变体何时用
deepseek-v4-flash(选择器里默认显示这个)快、便宜。适合小修小补、格式化、简单问答。
deepseek-v4-pro慢、聪明。需要真推理时用 —— 架构决策、难 bug、多步重构。

Cockpit 的 Agent SDK 还会用 deepseek-v4-flash 做后台小活(标题生成、压缩等),不管你选了哪个变体。

你能用到什么

  • 按 tab 在下拉里选 flashpro
  • 图片附件 —— Cmd+V 粘图片,DeepSeek 能看到(通过 Anthropic 兼容 API)。
  • 流式回复。
  • 工具调用 —— DeepSeek 能读文件、跑 shell 命令、改代码。
  • UI 里显示 token 用量。注意:token 条里的美元数额按 Cockpit 默认单价估算 —— 用作跨会话相对比较有用,实际 DeepSeek 账单去 DeepSeek 控制台看。

常见问题

  • "DeepSeek API key is not configured" —— 还没在选择器里粘 key。注意是 tab 头部的 DeepSeek 选择器,不是 Cockpit 的全局 Settings 弹窗。
  • "401 / 未授权" —— key 错或失效,回选择器再粘一次,留心别夹空格。
  • 回复慢 / 卡 —— pro 本来就比 flash 慢;不是真的需要推理就换回 flash
  • 成本估算涨得比预期快 —— proflash 贵好几倍;看 token 条能发现意外用了 pro 的会话。

Kimi

Kimi 是月之暗面(Moonshot)的中文市场 AI,以长上下文窗口闻名。Cockpit 通过月之暗面的 kimi CLI 驱动它 —— 装一次 CLI、登录一次,Cockpit 接着用。

接入

  1. 装月之暗面的 kimi CLI(按月之暗面官方安装说明)。

  2. 登录:

kimi

按提示用 Kimi / 月之暗面账号登录。

  1. 打开 Cockpit,新建 Agent tab,在引擎菜单选 Kimi。这个 tab 就用你的 Kimi 登录态了。

Cockpit 里不用粘任何东西 —— Cockpit 复用你机器上 kimi 已配置好的状态。

你能用到什么

  • CLI 自带的 Kimi 模型。
  • 流式回复,模型的"思考"过程会折叠在 <details> 块里展示在最终答案之前
  • 工具调用 —— Kimi 能读文件、跑 shell 命令、改代码。
  • 多 tab 会话,互相独立。

你拿不到什么

  • 没有图片附件。 Kimi tab 不接受图片输入,粘进来的图被静默丢弃。
  • 不显示实时成本。 Cockpit 无法从 kimi CLI 读出计费信息。去月之暗面控制台看账单。
  • 没有模型选择器。 你的 kimi CLI 自带哪个模型就用哪个。

常见问题

  • "找不到 kimi" / 发消息没反应 —— kimi CLI 不在 PATH 里。在终端跑 kimi --version 验证;不行的话装一下。
  • 登录过期 —— 在终端重跑一次 kimi 走登录流程。
  • CLI 版本旧了 —— 月之暗面定期更新 kimi CLI。行为怪怪的话按月之暗面文档升级。

Ollama

Ollama 是 Cockpit 里唯一全程跑在你自己机器上的引擎。不要 API key,不上云,不按 token 计费。装好 Ollama、拉你要的模型,Cockpit 就在模型选择器里列出来。

什么时候选它:

  • 在飞机上或断网。
  • 在处理不该离开本机的敏感代码。
  • 你有一台强 GPU 工作站,想把它用起来。
  • 你在试自定义或微调过的模型。

接入

  1. ollama.com 装 Ollama。

  2. 至少拉一个模型:

ollama pull llama3.1

之后可以随时再拉:ollama pull qwen3.5ollama pull deepseek-coder 等。完整列表见 Ollama 模型库

  1. 在 Cockpit 新建 Agent tab,引擎菜单选 Ollama如果 Ollama 服务没在跑,Cockpit 自动 spawn('ollama', 'serve') 启动它,然后最多等 8 秒就绪。

  2. 点 tab 头部的模型下拉 —— Cockpit 调 Ollama API 拿你拉过的所有模型列出。

你能用到什么

  • 你拉过的任意模型,按 tab 选。
  • 流式回复。
  • 工具调用 (取决于模型 —— 代码微调模型支持工具调用,通用聊天模型常常不支持)
  • 完全离线运行。没有任何出网调用。
  • 每条消息零成本。

你拿不到什么

  • 没有图片附件。 Cockpit 的 Ollama tab 目前只走文本,即便你拉的是视觉模型。
  • 没有"最佳实践"模型选择器。 Ollama 只给你你拉过的 —— Cockpit 不替你选。代码里有一个用于保底的默认模型,但实际使用时你应该自己挑。不确定的话从已知好用的代码模型开始,比如 qwen3.5-coderdeepseek-coder

怎么选模型

粗略的硬件对应表 —— 实际性能取决于 GPU:

你的硬件合理的模型规模
MacBook Air(8 GB 统一内存)1B – 3B 模型(很受限,质量低)
MacBook Pro M 系列(16–32 GB)7B – 13B 模型(日常代码问答够用)
Mac Studio / 台式机 64+ GB30B+ 模型(媲美较小的云端模型)
24 GB+ 独显工作站70B 模型(接近 Claude Haiku 级质量)

写代码场景特别推荐看 qwen3-coderdeepseek-codercodellama 系列。同等规模下比通用聊天模型实用得多。

常见问题

  • 下拉里"没有模型" —— 你还没拉过。打开终端跑 ollama pull <名字> 至少装一个。
  • 回复极慢 —— 模型太大,超出 GPU 舒适承受范围。换个小的。
  • 自动启动没起来 —— 在终端手动跑 ollama serve 再试。