claude -p の「使い放題」が終わった日 ― 自動化を$200に収めるトークン効率4テク

295 Views

June 15, 26

#claudecode #トークン効率 #生成ai #aiエージェント #コスト最適化 #llm #Claude-p #コスト設計 #API利用 #自動化

スライド概要

2026年6月15日、Claude Codeの claude -p（ヘッドレス実行）と Agent SDK が、対話用サブスクの利用枠から切り離され、別の月次クレジット（Max 20x = $200/月、API標準レート、繰り越しなし、枯渇で停止）を消費するようになりました。

自動化のコストが見えるようになったいま、効率化は美徳ではなく原価管理です。27本のcronを $200 に収めるための4つのテク（工程ごとのモデル使い分け／LLMに判断させない工程を剥がす／コンテキスト軽量化／実行頻度とバッチ化）を、実運用ベースで10枚に圧縮しました。

▼Zenn記事で全文（無料）
https://zenn.dev/kenimo49/articles/claude-p-token-efficiency-200

著者: ken imoto / Propel-lab / kenimoto.dev

井本賢

@kenimo49

スライド一覧

Propel-Lab代表。WebRTC・音声AIのエンジニアをやりながら、LLMを仕事の戦力にするための設計を研究しています。中心テーマは「ハーネス・エンジニアリング」——AIの成果はモデルそのものより、その外側の環境（制約・フィードバック・ツール）で決まる、という考え方です。これとContext Engineering、AIコードレビューの自動化などをZennとKindleで本にしてきました。ここには各本の要点をスライドにまとめて置いていきます。詳しくは kenimoto.dev へ。

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

AIコードレビューを仕組み化する ― hooks・AI・人間の3層モデル

コードレビュー claudecode coderabbit hooks aiエージェント生成ai

井本賢 12.7K

コードレビュー指摘300件を3ヶ月分類したら効いていたのは2種類だけだった ─ Bug/Spec死守・残り4種類はPRから外す

コードレビューハーネスエンジニアリング aiコードレビュー開発生産性メトリクス conventionalcomments

井本賢 8.6K

cpu-moeで満足するな — Qwen 35Bをさらに速くする3フラグ実測 (RTX 4070)

ローカルllm llama.cpp rtx4070 qwen 生成ai

井本賢 3.1K

1Passwordが渡していない2つのもの ― マスターパスワードと、チーム共有鍵

セキュリティ 1password 暗号認証 srp パスワード管理 contextengineering

井本賢 2.8K

9Bが死んで35Bが動く — RTX 4070でQwen 3.5を全モデル検証

ローカルllm qwen gpu ollama 生成ai

井本賢 2.6K

もうプロンプトは書かない、ループを書く ― Claude Code作者とOpenClaw作者が辿り着いた /goal と /loop

claudecode aiエージェント生成ai 自動化 llm ハーネスエンジニアリング contextengineering

井本賢 2.3K

各ページのテキスト

CLAUDE CODE / 自動化のコスト設計「使い放題」が終わった日 claude -p の自動化を $200 に収める — トークン効率4テク ken imoto エンジニア / Propel-lab トークン効率4テク kenimoto.dev

2026年6月15日、別財布になった claude -p と Agent SDK は、対話用サブスク枠の「外」へ。 6/15まで - 対話サブスク枠の内側 - 深夜に走らせても追加請求なし - 実質「使い放題」 6/15から - 別の月次クレジット (Max 20x = $200/月) - API標準レートで消費・繰り越しなし - 枯渇したら、その月は停止トークン効率4テク 02 kenimoto.dev

APIキーは「安全網」にならない ANTHROPIC_API_KEY はサブスク認証より優先される。 $1,800 超 / わずか2日で「枯渇したらAPIキーで継続」のつもりが、最初からAPI従量課金が走る。クレジットとは無関係に。優先順位を見落としたMaxユーザーの実例。 anthropics/claude-code Issue #37686 トークン効率4テク 03 kenimoto.dev

効率化は、もう美徳ではないサブスクの内側で無料だった無駄が、今月から課金になる。 6/15まで無駄もタダ冗長なプロンプト・必要以上に賢いモデル・毎日走る重い判断。どれも「動いているからヨシ」。 6/15から効率化=原価管理同じ無駄が$200を食い潰す。自動化の良し悪しは、機能ではなく原価で決まる。トークン効率4テク 04 kenimoto.dev

テク1 — 工程ごとにモデルを使い分けるすべてを最上位モデルで回す必要はない。観測 Observer スナップショットを読んで集計。判断はほぼ不要（実測約0~1秒） Haiku 一番安いモデルで十分方針 Strategist 観測から次にどう動くかを決める。判断が重い Sonnet 判断はここに実行 Executor 重い生成タスクを処理（実測約3,000秒） Opus 質が効く工程だけ最上位工程の重さとモデル単価を一致させる。Haiku ≪ Sonnet ≪ Opus の価格差を味方に。トークン効率4テク 05 kenimoto.dev

テク2 — 判断のいらない工程を剥がす一番安いトークンは、呼ばないトークン。 Before - claude -p に「何時に予約して」と時刻計算までさせる - 衝突回避もずらしもLLM任せ - 判断不要なのにトークンを消費 After - 空き枠計算も at 登録もシェルで完結 - claude -p は重い生成だけ - 速く・確実で・そして無料トークン効率4テク 06 kenimoto.dev

テク3 — コンテキストを軽くする毎回必ずかかる入力トークンは、固定費。 ① 常時ロードを削る CLAUDE.md・記憶を索引化全cronの全実行に乗る分。インデックス1行+詳細は別ファイルに分割する ② 必要な時だけ重くスキルを detect / rewrite に分割違反ゼロなら軽い版だけで終わる。巨大スキルを毎回読ませない ③ キャッシュを効かせる 1セッションでまとめて回す共通の前提はプロンプトキャッシュで割引。細切れ呼び出しより有利入力トークンは「派手ではないが、毎回必ずかかる固定費」。固定費を削るのは家計と同じで地味に効く。トークン効率4テク 07 kenimoto.dev

テク4 — 実行頻度とバッチ化重い工程はまとめて少なく、軽い工程はこまめに。毎日判断させる重い判断 × 7回/週「今日は何をするか」を毎日週1で1週間分重い判断 × 1回/週あとは計画に沿って実行するだけ判断工程の呼び出しが7分の1に。観測のような軽い工程は、安いモデルで毎日でも痛くない。トークン効率4テク 08 kenimoto.dev

$200 予算の組み方原価が見えていないものは、管理できない。テク何を削るか効き目モデル使い分け重い工程以外を安いモデルに大 LLMから処理を剥がす決定的な処理をコードに戻す大コンテキスト軽量化毎回かかる固定の入力費中頻度・バッチ化重い工程の呼び出し回数中最初の一手は、効率化ですらなく計測。どの工程が$200を食っているか見えれば、どのテクを優先すべきかが決まる。トークン効率4テク 09 kenimoto.dev

10.

全文は、Zennで。 Zenn 記事（無料） zenn.dev/kenimo49/articles/claude-p-token-efficiency-200 Propel-lab propel-lab.co.jp 6/15 の claude -p 課金分離と、自動化を $200 に収めるトークン効率4テクを、27本の cron を回す実運用ベースで。 ken imoto — kenimoto.dev トークン効率4テク 10 kenimoto.dev