~/field-notes — leeguoo@misonote — zsh EN ● 中文 日本語
❯ field-notes v3.4.1
leeguoo@misonote:/zh/posts/chatgpt-imagegen-visual-guide/ $ 文章

# ChatGPT 订阅 → 生图 API 可视化速览:chatgpt-imagegen 一图看懂

一页可视化速览:ChatGPT 订阅是怎么被 chatgpt-imagegen 转成命令行生图工具的——OAuth 取 token、Responses API SSE 流、能力边界矩阵、不该用的场景一图说清。

2026年5月26日 · 文章 · 公开 · 文章

visual guide · 一页看懂

把 ChatGPT 订阅当成你的生图 API

已经付了 ChatGPT Plus / Pro / Team 的月费,但需要在命令行或 AI agent 里生图?不用再单独充值 OPENAI_API_KEY——一个 300 行的 Python CLI 直接复用订阅额度。

$ chatgpt-imagegen "a watercolor cat sitting on a windowsill" -o cat.png -> saved: cat.png (812,344 bytes) size=1024x1024 quality=medium # 一行命令,没有 API key、没有代理、没有 daemon

OpenAI 生图其实有两条路

大部分开发者只见过左边那条。右边这条对非 Codex CLI 用户基本不可见——但你每月付的订阅费里其实已经买了它。

路径 A

官方 API

单图计费 · 需要 OPENAI_API_KEY
POST /v1/images/generations
路径 B · 隐藏通道

ChatGPT 订阅

月费固定 · 凭 ~/.codex/auth.json 鉴权
POST chatgpt.com/backend-api/codex/responses

路径 B 就是 OpenAI Codex CLI 内置 image_gen 工具走的端点。chatgpt-imagegen 干的事就是把这条路抠出来贴个 CLI 壳,可脚本化、可被 AI agent 直接调用。

30 秒装好

# 前置:装 Codex CLI,登录一次 ChatGPT 订阅账号 $ npm i -g @openai/codex $ codex login # 方式 A:作为 AI agent skill 装(Claude Code / Cursor / Codex Agent) $ npx skills add leeguooooo/chatgpt-imagegen -g # 方式 B:独立 CLI $ git clone https://github.com/leeguooooo/chatgpt-imagegen $ sudo install chatgpt-imagegen/chatgpt-imagegen /usr/local/bin/

内部协议:一次调用发生了什么

1
读 Codex 登录态 ~/.codex/auth.json · ~/.codex/version.json
2
构造 Responses API 请求 tools: [{type: "image_generation"}]
3
POST 到内部端点 chatgpt.com/backend-api/codex/responses
4
消费 SSE 流 image_generation_call.in_progress → generating → output_item.done
5
解码并落盘 item.result (base64 PNG) → cat.png
6
token 过期自动续 auth.openai.com/oauth/token (refresh_token) → 写回 auth.json

能力矩阵:什么能做,什么做不到

能力 订阅通道 说明
--size ✅ 生效 实测稳定:1024x10241024x15361536x1024。更大尺寸透传,是否成功看订阅档位
--format ✅ 生效 png / jpeg / webp 都行
画质 quality ⚠️ 服务端决定 订阅通道不暴露可控的 quality 字段,请求 high 会被悄悄降级——所以 CLI 干脆没加这个旗标
透明背景 background: transparent ❌ 不支持 必须走官方 API + gpt-image-1.5
图像编辑 /v1/images/edits ❌ 未实现 有需求可在仓库提 issue
速度 15–40 s / 张 全链路 SSE 流式

并发实测

并发请求全部 200 返回
~27s
总耗时 ≈ 最慢单张
0
429 / 串行化
≤10/min
建议持续速率上限

实测 Plus 账号同时打 4 个 chatgpt-imagegen,服务端没有限速也没有串行化。但订阅额度和 ChatGPT 网页端、Codex CLI 共享——别长期 >10 张/分钟,会撞每日限流。

什么时候不应该用这个工具

下面任何一条命中,请直接走官方 API:
  • 需要严格的 quality=high 或透明背景——订阅通道给不了
  • 正在做面向终端用户的生产服务——这既违反 OpenAI 服务条款,也会把你自己用 ChatGPT 的额度烧光
  • 要做逐次精确的成本归集——订阅是月费,没法分摊到每次调用
  • 要稳定的 >10 张/分钟吞吐——订阅限流更紧

二选一:本地 CLI 还是 HTTP 网关?

本仓库

chatgpt-imagegen

笔记本上偶尔生图、给 AI agent 当 skill、shell 脚本里调用。一个 Python 文件,无网络服务。

姊妹项目

agent-cli-to-api

把同一条订阅通道包成 OpenAI 兼容的 /v1/chat/completions HTTP 服务,给团队 / 多客户端 / 远程调用用。

给 AI agent 用的场景

这是这个项目最核心的使用场景。过去想让 Claude Code / Cursor / Codex Agent "顺手画一张"通常意味着多塞一个 OPENAI_API_KEY 或者听它说"我没法生图"。装上这个 skill 之后:

$ npx skills add leeguooooo/chatgpt-imagegen -g

agent 直接复用你已经付了的订阅额度——不需要新 key、新账号、新环境变量。仓库里 SKILL.md 已经写好了 agent 应该什么时候调它、尺寸怎么选、错误怎么处理。

延伸阅读

技术文:300 行 Python 拆解 GitHub 仓库 HTTP 网关:agent-cli-to-api

← 上一篇
从软方法到硬补丁 — 一次 macOS Mach-O 逆向的方法论复盘
下一篇 →
直面 AI 审计:如何将逆向工程项目"合法化"?

评论

评论发布后会立即公开,如触发规则可能被审核下架。

最多 1000 字。

    ⎇ main ● 0 errors · 0 warnings UTF-8 Markdown /zh/posts/chatgpt-imagegen-visual-guide/ © 2026 leeguoo