Agent 面板

AI 引擎

Cockpit 开箱支持 5 个 AI 引擎(再加一个 Claude 2 入口,共 6 个 tab 选项)。每个 Agent tab 选一个,可以跨 tab 混用,不用重启 —— 按本地是否有模型、账号在谁那、当前任务哪个最擅长来挑。

引擎	登录方式	何时用
Claude	Anthropic `claude` CLI 登录(或 Claude 2 用第二个账号)	默认。综合能力最强。
Codex	`codex` CLI 登录	已经有 Codex / GPT 订阅时。
DeepSeek	在 DeepSeek 选择器里粘 API key	推理强、便宜。
Kimi	`kimi` CLI 登录	长上下文,国内多用。
Ollama	不用 —— 本地跑	离线、敏感数据、自定义模型。

一切都在本地完成。

Overview

一览

引擎	怎么登录	何时用	钱付给谁
Claude	终端跑一次 `claude` CLI 登录	默认。最强通用模型。	Anthropic
Codex	终端跑一次 `codex` CLI 登录	已有 Codex / GPT 订阅时。	OpenAI
DeepSeek	在引擎头部的 DeepSeek 选择器里粘 API key	推理强、价格低。	DeepSeek
Kimi	终端跑一次 `kimi` CLI 登录	长上下文,国内主用。	月之暗面
Ollama	不需要 —— 本地	离线、敏感数据、自定义模型。	没人(你自己的电脑)

引擎选择器里还有一个 Claude 2 —— 它跟 Claude 是同一个引擎,只是用第二份配置目录(~/.claude2)指向第二个 Anthropic 账号,让你能同时跑两个 Claude tab 走不同账单。配置方式见 Claude 章。

引擎选择怎么工作

每个 Agent tab 头部有引擎选择器。新建 tab 时引擎默认是 Claude。给已有 tab 换引擎会开新会话 —— Claude 历史无法带到 Codex tab,因为每个引擎都有自己的对话格式。

可以同时开比如 5 个 tab:

Tab 1:Claude 跑 ~/code/backend
Tab 2:DeepSeek 跑同项目做便宜的二次意见
Tab 3:Codex 跑另一个项目
Tab 4:Kimi 跑笔记本,附一份长 PDF
Tab 5:Ollama 跑本地模型,离线写草稿

Cockpit 的会话浏览器(侧栏顶部网格图标)能看到全部。

各引擎能做什么

	Claude	Codex	DeepSeek	Kimi	Ollama
能读 & 改你的文件	✅	✅	✅	✅	⚠️ 看模型
接受图片附件	✅	✅	✅	❌	❌
流式输出(边想边说)	✅	✅	✅	✅	✅
离线可用	❌	❌	❌	❌	✅
多模型变体可选	固定(最新版)	固定	flash / pro	固定	你拉过的任意模型
UI 里显示实时成本	✅	—	✅(估算)	—	免费

图片支持是引擎级。Kimi 和 Ollama 收到图片附件会静默丢弃(不报错,但 AI 看不到)。

各引擎接入

每个引擎都有自己的章节。快速指引:

Claude —— 在终端跑一次 claude 按提示登录。Cockpit 自动复用你的 Claude 登录态。
Codex —— 装 OpenAI 的 codex CLI 并用它登录一次。Cockpit 复用同一份登录态。
DeepSeek —— 从 platform.deepseek.com 拿 key,在 Agent tab 头部的 DeepSeek 选择器里粘(不是全局 Settings)。然后在同一个选择器里选模型变体。
Kimi —— 装月之暗面的 kimi CLI 并用它登录一次。Cockpit 复用同一份登录态。
Ollama —— 装 Ollama 并拉至少一个模型(ollama pull llama3.1)。新建 Ollama tab 时,模型选择器会列出你拉过的所有模型。

Claude

Claude 是 Cockpit 的默认引擎 —— 启动应用、新开一个 tab,你默认在跟 Claude 聊。Cockpit 不替你管理 Claude 登录,它复用 Anthropic 的 claude CLI,所以你在那边做过的事(订阅、项目设置、MCP 服务器)在 Cockpit 里也都生效。

接入

你需要装好并登录 Anthropic 的 claude CLI。

还没装 Claude Code 的话先装:

npm install -g @anthropic-ai/claude-code

claude

claude 命令会引导你完成浏览器登录。登录完成后 Cockpit 自动接管,无需再在 Cockpit 里配置什么。

就这样。打开 Cockpit,新建 Agent tab,开始聊。

你能用到什么

Anthropic 推荐的最新 Claude 模型,走 Claude Agent SDK。
图片附件 —— 粘贴图片到聊天(Cmd+V),Claude 能看到。PNG / JPEG / WEBP / GIF,每张 5 MB 以内;能附多张。
工具调用 —— Claude 能读你的文件、跑 shell 命令、改代码、访问 URL、用 MCP 工具。
流式输出 —— 回复一边想一边出。
UI 里显示成本 —— 每条消息都显示用了多少 token,整个会话的累计 USD 也实时更新。

用第二个 Claude 账号:"Claude 2"

如果你有两个 Anthropic 账号 —— 比如一个个人、一个公司账单 —— Cockpit 允许两个同时用。引擎选择器里会看到两个条目:Claude 和 Claude 2。它们是完全同一个引擎;"Claude 2" 只是把 CLAUDE_CONFIG_DIR 指向 ~/.claude2,让两个 tab 不共用账单。

第二个账号的配置方式:

开一个干净的终端,告诉 claude 用第二个配置目录:

CLAUDE_CONFIG_DIR=~/.claude2 claude

按提示用第二个 Anthropic 账号登录。
回到 Cockpit,新开一个 tab 在引擎菜单选 Claude 2。这个 tab 就接到第二个账号了。

可以并排开一个 Claude tab(个人)+ 一个 Claude 2 tab(工作)。Cockpit 分开统计两边的 token 和成本。

路径必须正好是 ~/.claude2(代码里硬编码)。改成别的路径 Cockpit 找不到。如果你只有一个 Claude 账号,完全无视 "Claude 2"。

模型切换

Cockpit 始终用 Anthropic 当前推荐的 Claude 模型。没有模型选择器 —— 服务给的最新版你就用最新版。要关注当前是哪个模型,看 Anthropic 的官方公告;官方 SDK 更新时 Cockpit 自动跟进。

常见问题

第一条消息就报"未登录"/ 直接出错 —— 在终端跑一次 claude,确认登录走完。Cockpit 只能用 claude 自己已经能用的那份登录。
白天要切账号 —— 走 Claude 2 比登出再登入简单得多。

Codex

如果你有 Codex / ChatGPT 订阅,可以在 Cockpit 里用同一份登录态驱动它。Cockpit 不直接走 OpenAI API —— 这个引擎底下是 spawn('codex', ...) 跑 OpenAI 自己的 codex CLI,然后把它的输出展示给你。

接入

装 OpenAI 的 codex CLI(当前安装命令以 OpenAI 官方文档为准,一般一行命令搞定)。
登录:

codex

按提示用 OpenAI 账号登录。

打开 Cockpit,新建 Agent tab,在引擎菜单选 Codex。这个 tab 就用你的 Codex 登录态了。

Cockpit 里不用粘任何东西 —— Cockpit 复用你机器上 codex 已配置好的状态。

你能用到什么

CLI 自带的 Codex 模型(没有应用内模型选择器 —— 你装的 codex 给你什么就用什么)。
图片附件 —— Cockpit 把粘进来的图片落到临时文件,通过 --image 参数传给 codex CLI。PNG / JPEG / WEBP / GIF 都行。
流式回复。
工具调用 —— Codex 能读文件、跑 shell 命令、改代码。
多 tab 会话 —— 想开几个 Codex tab 就开几个,互相独立。

你拿不到什么

不显示实时成本。 Cockpit 无法从 codex CLI 读出计费信息,所以 Codex tab 的 token 条是空的(total_cost_usd: 0)。去 OpenAI 控制台看用量。
没有模型选择器。 你的 codex CLI 用哪个模型就用哪个。

常见问题

"找不到 codex" / 发消息没反应 —— codex CLI 不在 PATH 里。在终端跑 codex --version 验证;不行的话重装。
登录过期 —— 在终端重跑一次 codex 走登录流程。Cockpit 不管登录本身。
CLI 版本旧了 —— OpenAI 定期更新 codex。行为怪怪的话升级一下。

DeepSeek

DeepSeek 是 Cockpit 里最便宜的云端引擎,也是除 Claude 之外唯一能按 tab 选模型变体的。跟 Claude / Codex / Kimi 不同(那些复用 CLI 登录态),DeepSeek 只走 API key —— 在 tab 头部的 DeepSeek 选择器里粘一个 key 就完事。

底层走 DeepSeek 的 Anthropic 兼容端点,通过 Claude Agent SDK 路由请求,所以工具调用、流式、上下文管理跟 Claude 一样。

接入

从 platform.deepseek.com 拿一个 API key。形如 sk-...。
在 Cockpit 打开一个新 tab、在引擎菜单选 DeepSeek,然后点 tab 头部的 DeepSeek 选择器图标 → 粘 key → 保存(key 存在本地 ~/.cockpit/settings.json 里,不在 Cockpit 全局 Settings 弹窗里)。
同一个选择器里挑模型变体。

完事。key 永远只待在本机。

选模型变体

变体	何时用
`deepseek-v4-flash`(选择器里默认显示这个)	快、便宜。适合小修小补、格式化、简单问答。
`deepseek-v4-pro`	慢、聪明。需要真推理时用 —— 架构决策、难 bug、多步重构。

Cockpit 的 Agent SDK 还会用 deepseek-v4-flash 做后台小活(标题生成、压缩等),不管你选了哪个变体。

你能用到什么

按 tab 在下拉里选 flash 或 pro。
图片附件 —— Cmd+V 粘图片,DeepSeek 能看到(通过 Anthropic 兼容 API)。
流式回复。
工具调用 —— DeepSeek 能读文件、跑 shell 命令、改代码。
UI 里显示 token 用量。注意:token 条里的美元数额按 Cockpit 默认单价估算 —— 用作跨会话相对比较有用,实际 DeepSeek 账单去 DeepSeek 控制台看。

常见问题

"DeepSeek API key is not configured" —— 还没在选择器里粘 key。注意是 tab 头部的 DeepSeek 选择器,不是 Cockpit 的全局 Settings 弹窗。
"401 / 未授权" —— key 错或失效,回选择器再粘一次,留心别夹空格。
回复慢 / 卡 —— pro 本来就比 flash 慢;不是真的需要推理就换回 flash。
成本估算涨得比预期快 —— pro 比 flash 贵好几倍;看 token 条能发现意外用了 pro 的会话。

Kimi

Kimi 是月之暗面(Moonshot)的中文市场 AI,以长上下文窗口闻名。Cockpit 通过月之暗面的 kimi CLI 驱动它 —— 装一次 CLI、登录一次,Cockpit 接着用。

接入

装月之暗面的 kimi CLI(按月之暗面官方安装说明)。
登录:

kimi

按提示用 Kimi / 月之暗面账号登录。

打开 Cockpit,新建 Agent tab,在引擎菜单选 Kimi。这个 tab 就用你的 Kimi 登录态了。

Cockpit 里不用粘任何东西 —— Cockpit 复用你机器上 kimi 已配置好的状态。

你能用到什么

CLI 自带的 Kimi 模型。
流式回复,模型的"思考"过程会折叠在 <details> 块里展示在最终答案之前。
工具调用 —— Kimi 能读文件、跑 shell 命令、改代码。
多 tab 会话,互相独立。

你拿不到什么

没有图片附件。 Kimi tab 不接受图片输入,粘进来的图被静默丢弃。
不显示实时成本。 Cockpit 无法从 kimi CLI 读出计费信息。去月之暗面控制台看账单。
没有模型选择器。 你的 kimi CLI 自带哪个模型就用哪个。

常见问题

"找不到 kimi" / 发消息没反应 —— kimi CLI 不在 PATH 里。在终端跑 kimi --version 验证;不行的话装一下。
登录过期 —— 在终端重跑一次 kimi 走登录流程。
CLI 版本旧了 —— 月之暗面定期更新 kimi CLI。行为怪怪的话按月之暗面文档升级。

Ollama

Ollama 是 Cockpit 里唯一全程跑在你自己机器上的引擎。不要 API key,不上云,不按 token 计费。装好 Ollama、拉你要的模型,Cockpit 就在模型选择器里列出来。

什么时候选它:

在飞机上或断网。
在处理不该离开本机的敏感代码。
你有一台强 GPU 工作站,想把它用起来。
你在试自定义或微调过的模型。

接入

从 ollama.com 装 Ollama。
至少拉一个模型:

ollama pull llama3.1

之后可以随时再拉:ollama pull qwen3.5、ollama pull deepseek-coder 等。完整列表见 Ollama 模型库。

在 Cockpit 新建 Agent tab,引擎菜单选 Ollama。如果 Ollama 服务没在跑,Cockpit 自动 spawn('ollama', 'serve') 启动它,然后最多等 8 秒就绪。
点 tab 头部的模型下拉 —— Cockpit 调 Ollama API 拿你拉过的所有模型列出。

你能用到什么

你拉过的任意模型,按 tab 选。
流式回复。
工具调用 (取决于模型 —— 代码微调模型支持工具调用,通用聊天模型常常不支持)。
完全离线运行。没有任何出网调用。
每条消息零成本。

你拿不到什么

没有图片附件。 Cockpit 的 Ollama tab 目前只走文本,即便你拉的是视觉模型。
没有"最佳实践"模型选择器。 Ollama 只给你你拉过的 —— Cockpit 不替你选。代码里有一个用于保底的默认模型,但实际使用时你应该自己挑。不确定的话从已知好用的代码模型开始,比如 qwen3.5-coder 或 deepseek-coder。

怎么选模型

粗略的硬件对应表 —— 实际性能取决于 GPU:

你的硬件	合理的模型规模
MacBook Air(8 GB 统一内存)	1B – 3B 模型(很受限,质量低)
MacBook Pro M 系列(16–32 GB)	7B – 13B 模型(日常代码问答够用)
Mac Studio / 台式机 64+ GB	30B+ 模型(媲美较小的云端模型)
24 GB+ 独显工作站	70B 模型(接近 Claude Haiku 级质量)

写代码场景特别推荐看 qwen3-coder、deepseek-coder、codellama 系列。同等规模下比通用聊天模型实用得多。

常见问题

下拉里"没有模型" —— 你还没拉过。打开终端跑 ollama pull <名字> 至少装一个。
回复极慢 —— 模型太大,超出 GPU 舒适承受范围。换个小的。
自动启动没起来 —— 在终端手动跑 ollama serve 再试。

在 GitHub 编辑此页 ↗