AI 对话 (chat/ask)

Headless 命令 — 不依赖桌面 GUI，直接使用核心包运行。适用于服务器、CI/CD、容器化等无桌面环境。

概述

chat 和 ask 命令提供命令行环境下的 AI 对话能力，支持 8 个 LLM 提供商的流式交互式对话和单次问答。chat 支持代理模式（--agent）以启用文件读写和命令执行等工具调用，对话历史自动保存到本地数据库并追踪 Token 用量。

核心特性

🗣️ 流式输出: 实时显示 AI 回复，支持 Markdown 渲染
🔄 多提供商: 支持 Ollama、OpenAI、Anthropic、DeepSeek、DashScope、Gemini、Mistral、Volcengine(豆包) 等 8 个提供商
🤖 代理模式: --agent 参数启用工具调用（读写文件、执行命令）
📝 会话自动保存: 对话历史自动持久化到数据库
💰 Token 追踪: 自动记录每次对话的 Token 用量和成本

系统架构

chat 命令 → chat-repl.js (REPL 循环)
                │
    ┌───────────┼───────────┐
    ▼           ▼           ▼
 用户输入   llm-providers  session-manager
 (readline)  (8 providers)  (自动保存)
    │           │           │
    ▼           ▼           ▼
 斜杠命令   流式 API 调用   SQLite sessions 表
 解析       token-tracker

chat — 交互式对话

启动交互式 AI 对话，支持流式输出。

bash

chainlesschain chat                     # 默认: Ollama qwen2:7b
chainlesschain chat --model llama3      # 使用其他模型
chainlesschain chat --provider openai --api-key sk-...
chainlesschain chat --agent             # 代理模式（可读写文件、执行命令）
chainlesschain chat --agent --session <id>  # 代理模式 + 恢复历史会话

对话内斜杠命令

命令	说明
`/exit`	退出对话
`/model`	切换模型
`/provider`	切换提供商
`/clear`	清空对话历史
`/history`	查看对话历史
`/help`	显示帮助

ask — 单次问答

非交互式单次 AI 问答，适用于脚本和 CI/CD 流水线。

bash

chainlesschain ask "什么是WebRTC?"
chainlesschain ask "解释这段代码" --model gpt-4o --provider openai
chainlesschain ask "Hello" --json       # JSON输出（含问题/回答/模型信息）

配置参考

bash

chainlesschain chat [options]          # 交互式对话
chainlesschain ask <question> [options]  # 单次问答

选项:
  --model <name>              模型名称（默认 qwen2:7b）
  --provider <provider>       LLM 提供商 (ollama/openai/volcengine/deepseek/
                              dashscope/gemini/mistral/anthropic)
  --base-url <url>            API 基础地址（中转站/代理）
  --api-key <key>             API 密钥（可从环境变量读取）
  --agent                     启用代理模式（工具调用）
  --session <id>              恢复历史会话（配合 --agent）
  --json                      JSON 输出（ask 专用）

对话内斜杠命令（chat REPL）:
  /exit /model /provider /clear /history /help

会话历史自动保存在 SQLite sessions 表中。Token 用量由 token-tracker 自动记录。

性能指标

操作	目标	实际	状态
REPL 启动	< 200ms	~80ms	✅
流式首 token 延迟（Ollama 本地）	< 1s	~400ms	✅
流式首 token 延迟（云端 API）	< 2s	~800ms	✅
斜杠命令解析	< 20ms	~5ms	✅
会话持久化（每轮）	< 50ms	~15ms	✅
ask 单次问答端到端	< 5s	~2s	✅

测试覆盖率

✅ chat.test.js  - 覆盖 chat/ask CLI 的主要路径
  ├── 参数解析 / 选项验证（provider/model/base-url/agent/session）
  ├── 正常路径（流式输出、8 provider 适配、agent 模式、ask 单次）
  ├── 错误处理 / 边界情况（连接失败、401、会话不存在、中文编码）
  └── JSON 输出格式（ask --json）

关键文件

packages/cli/src/commands/chat.js — chat/ask 命令实现
packages/cli/src/repl/chat-repl.js — 交互式对话 REPL（流式输出）
packages/cli/src/lib/llm-providers.js — 多 LLM 提供商适配

安全考虑

API Key 通过 --api-key 传递时不会写入历史记录
对话内容仅保存在本地数据库，不上传到第三方服务
使用 --provider ollama 时数据完全离线处理

使用示例

场景 1：本地离线对话

bash

chainlesschain chat
chainlesschain chat --model llama3

使用本地 Ollama 模型进行交互式对话，数据完全不出设备，适合处理敏感信息。

场景 2：使用火山引擎（豆包）聊天

bash

# 设置环境变量
export VOLCENGINE_API_KEY=ark-xxxxxxxxxxxx

# 使用旗舰模型
chainlesschain chat --provider volcengine

# 使用快速模型（成本更低、响应更快）
chainlesschain chat --provider volcengine --model doubao-seed-1-6-flash-250828

# 使用代码模型
chainlesschain chat --provider volcengine --model doubao-seed-code

场景 3：使用 OpenAI / DeepSeek 聊天

bash

# OpenAI
export OPENAI_API_KEY=sk-xxxxxxxxxxxx
chainlesschain chat --provider openai --model gpt-4o

# DeepSeek
export DEEPSEEK_API_KEY=sk-xxxxxxxxxxxx
chainlesschain chat --provider deepseek --model deepseek-chat

场景 4：通过中转站聊天（无需科学上网）

bash

# 通过 API2D 中转站使用 GPT-4o
chainlesschain chat \
  --provider openai \
  --base-url https://oa.api2d.net/v1 \
  --api-key fk-xxxxxx \
  --model gpt-4o

# 通过 One-API 网关使用任意模型
chainlesschain chat \
  --provider openai \
  --base-url http://localhost:3000/v1 \
  --api-key sk-oneapi-xxxxxx \
  --model deepseek-chat

# 火山引擎通过代理访问
chainlesschain chat \
  --provider volcengine \
  --base-url https://your-proxy.com/volcengine/v3 \
  --model doubao-seed-1-6-251015

场景 5：Agent 模式辅助开发

bash

# 本地 Ollama
chainlesschain chat --agent

# 火山引擎 Agent 模式（自动智能选择模型）
chainlesschain chat --agent --provider volcengine

# 通过中转站使用 GPT-4o Agent 模式
chainlesschain chat --agent \
  --provider openai \
  --base-url https://oa.api2d.net/v1 \
  --api-key fk-xxxxxx \
  --model gpt-4o

启用代理模式后，AI 可以读写文件、执行命令，适合代码生成、文件修改等开发场景。对话中使用 /help 查看可用工具。

场景 6：企业自建代理聊天

bash

# Nginx 反向代理
chainlesschain chat \
  --provider openai \
  --base-url https://ai-gateway.company.com/v1 \
  --model gpt-4o

# vLLM 部署的本地模型
chainlesschain chat \
  --provider openai \
  --base-url http://localhost:8000/v1 \
  --api-key dummy \
  --model my-finetuned-llama

场景 7：脚本集成单次问答 (ask)

bash

chainlesschain ask "将以下 JSON 转为 YAML 格式：{\"name\":\"test\"}" --json
chainlesschain ask "解释 WebRTC 的 ICE 候选流程" --provider openai --api-key sk-xxx
chainlesschain ask "什么是机器学习？" --provider volcengine

非交互模式适合在 CI/CD 流水线或脚本中调用，--json 输出便于程序解析。

故障排查

问题	解决方案
连接 Ollama 超时	确认 Ollama 已启动：`ollama serve`，检查端口 11434
OpenAI API 报错 401	检查 API Key 是否正确，是否有余额
中转站返回 401	检查 `--api-key` 格式，中转站密钥格式可能与官方不同
火山引擎认证失败	确认 `VOLCENGINE_API_KEY` 以 `ark-` 开头
中文乱码	确保终端编码为 UTF-8：`chcp 65001` (Windows)
流式输出卡住	检查网络连接，或切换到本地模型
`--base-url` 不生效	确保 URL 包含 `/v1` 后缀

AI 对话 (chat/ask) ​

概述 ​

核心特性 ​

系统架构 ​

chat — 交互式对话 ​

对话内斜杠命令 ​

ask — 单次问答 ​

配置参考 ​

性能指标 ​

测试覆盖率 ​

关键文件 ​

安全考虑 ​

使用示例 ​

场景 1：本地离线对话 ​

场景 2：使用火山引擎（豆包）聊天 ​

场景 3：使用 OpenAI / DeepSeek 聊天 ​

场景 4：通过中转站聊天（无需科学上网） ​

场景 5：Agent 模式辅助开发 ​

场景 6：企业自建代理聊天 ​

场景 7：脚本集成单次问答 (ask) ​

故障排查 ​

相关文档 ​

AI 对话 (chat/ask)

概述

核心特性

系统架构

chat — 交互式对话

对话内斜杠命令

ask — 单次问答

配置参考

性能指标

测试覆盖率

关键文件

安全考虑

使用示例

场景 1：本地离线对话

场景 2：使用火山引擎（豆包）聊天

场景 3：使用 OpenAI / DeepSeek 聊天

场景 4：通过中转站聊天（无需科学上网）

场景 5：Agent 模式辅助开发

场景 6：企业自建代理聊天

场景 7：脚本集成单次问答 (ask)

故障排查

相关文档