112 Views
June 15, 26
スライド概要
2026年6月15日、Claude Codeの claude -p(ヘッドレス実行)と Agent SDK が、対話用サブスクの利用枠から切り離され、別の月次クレジット(Max 20x = $200/月、API標準レート、繰り越しなし、枯渇で停止)を消費するようになりました。
自動化のコストが見えるようになったいま、効率化は美徳ではなく原価管理です。27本のcronを $200 に収めるための4つのテク(工程ごとのモデル使い分け/LLMに判断させない工程を剥がす/コンテキスト軽量化/実行頻度とバッチ化)を、実運用ベースで10枚に圧縮しました。
▼Zenn記事で全文(無料)
https://zenn.dev/kenimo49/articles/claude-p-token-efficiency-200
著者: ken imoto / Propel-lab / kenimoto.dev
CLAUDE CODE / 自動化のコスト設計 「使い放題」が終わった日 claude -p の自動化を $200 に収める — トークン効率4テク ken imoto エンジニア / Propel-lab トークン効率4テク kenimoto.dev
2026年6月15日、別財布になった claude -p と Agent SDK は、対話用サブスク枠の「外」へ。 6/15まで - 対話サブスク枠の内側 - 深夜に走らせても追加請求なし - 実質「使い放題」 6/15から - 別の月次クレジット (Max 20x = $200/月) - API標準レートで消費・繰り越しなし - 枯渇したら、その月は停止 トークン効率4テク 02 kenimoto.dev
APIキーは「安全網」にならない ANTHROPIC_API_KEY はサブスク認証より優先される。 $1,800 超 / わずか2日で 「枯渇したらAPIキーで継続」のつもりが、最初からAPI従量課金が走る。クレジットとは無関係に。 優先順位を見落としたMaxユーザーの実例。 anthropics/claude-code Issue #37686 トークン効率4テク 03 kenimoto.dev
効率化は、もう美徳ではない サブスクの内側で無料だった無駄が、今月から課金になる。 6/15まで 無駄もタダ 冗長なプロンプト・必要以上に賢いモデル・毎日走る重い判断。どれも「動いているからヨシ」。 6/15から 効率化=原価管理 同じ無駄が$200を食い潰す。自動化の良し悪しは、機能ではなく原価で決まる。 トークン効率4テク 04 kenimoto.dev
テク1 — 工程ごとにモデルを使い分ける すべてを最上位モデルで回す必要はない。 観測 Observer スナップショットを読んで集計。判断はほぼ不要(実測 約0~1秒) Haiku 一番安いモデルで十分 方針 Strategist 観測から次にどう動くかを決める。判断が重い Sonnet 判断はここに 実行 Executor 重い生成タスクを処理(実測 約3,000秒) Opus 質が効く工程だけ最上位 工程の重さとモデル単価を一致させる。Haiku ≪ Sonnet ≪ Opus の価格差を味方に。 トークン効率4テク 05 kenimoto.dev
テク2 — 判断のいらない工程を剥がす 一番安いトークンは、呼ばないトークン。 Before - claude -p に「何時に予約して」と時刻計算までさせる - 衝突回避もずらしもLLM任せ - 判断不要なのにトークンを消費 After - 空き枠計算も at 登録もシェルで完結 - claude -p は重い生成だけ - 速く・確実で・そして無料 トークン効率4テク 06 kenimoto.dev
テク3 — コンテキストを軽くする 毎回必ずかかる入力トークンは、固定費。 ① 常時ロードを削る CLAUDE.md・記憶を索引化 全cronの全実行に乗る分。インデックス1行+詳細は別ファイルに分割する ② 必要な時だけ重く スキルを detect / rewrite に分割 違反ゼロなら軽い版だけで終わる。巨大スキルを毎回読ませない ③ キャッシュを効かせる 1セッションでまとめて回す 共通の前提はプロンプトキャッシュで割引。細切れ呼び出しより有利 入力トークンは「派手ではないが、毎回必ずかかる固定費」。固定費を削るのは家計と同じで地味に効く。 トークン効率4テク 07 kenimoto.dev
テク4 — 実行頻度とバッチ化 重い工程はまとめて少なく、軽い工程はこまめに。 毎日判断させる 重い判断 × 7回/週 「今日は何をするか」を毎日 週1で1週間分 重い判断 × 1回/週 あとは計画に沿って実行するだけ 判断工程の呼び出しが7分の1に。観測のような軽い工程は、安いモデルで毎日でも痛くない。 トークン効率4テク 08 kenimoto.dev
$200 予算の組み方 原価が見えていないものは、管理できない。 テク 何を削るか 効き目 モデル使い分け 重い工程以外を安いモデルに 大 LLMから処理を剥がす 決定的な処理をコードに戻す 大 コンテキスト軽量化 毎回かかる固定の入力費 中 頻度・バッチ化 重い工程の呼び出し回数 中 最初の一手は、効率化ですらなく計測。どの工程が$200を食っているか見えれば、どのテクを優先すべきかが決まる。 トークン効率4テク 09 kenimoto.dev
全文は、Zennで。 Zenn 記事(無料) zenn.dev/kenimo49/articles/claude-p-token-efficiency-200 Propel-lab propel-lab.co.jp 6/15 の claude -p 課金分離と、自動化を $200 に収めるトークン効率4テクを、27本の cron を回す実運用ベースで。 ken imoto — kenimoto.dev トークン効率4テク 10 kenimoto.dev