Keyboard shortcuts

Press or to navigate between chapters

Press S or / to search in the book

Press ? to show this help

Press Esc to hide this help

Úspory

PRECC sleduje odhadované úspory tokenů z každého zachycení. Použijte precc savings pro zobrazení, kolik plýtvání PRECC zabránil.

Rychlý souhrn

$ precc savings
Session Token Savings
=====================
Total estimated savings: <span data-stat="session_tokens_saved">8,741</span> tokens

Breakdown:
  Pillar 1 (cd prepends):         <span data-stat="session_p1_tokens">3,204</span> tokens  (<span data-stat="session_p1_count">6</span> corrections)
  Pillar 4 (skill activations):   <span data-stat="session_p4_tokens">1,560</span> tokens  (<span data-stat="session_p4_count">4</span> activations)
  RTK rewrites:                   <span data-stat="session_rtk_tokens">2,749</span> tokens  (<span data-stat="session_rtk_count">11</span> rewrites)
  Lean-ctx wraps:                 <span data-stat="session_lean_tokens">1,228</span> tokens  (<span data-stat="session_lean_count">2</span> wraps)

Podrobný rozpis (Pro)

$ precc savings --all
Session Token Savings (Detailed)
================================
Total estimated savings: <span data-stat="session_tokens_saved">8,741</span> tokens

Command-by-command:
  #  Time   Command                          Saving   Source
  1  09:12  cargo build                      534 tk   cd prepend (cargo-wrong-dir)
  2  09:14  cargo test                       534 tk   cd prepend (cargo-wrong-dir)
  3  09:15  git status                       412 tk   cd prepend (git-wrong-dir)
  4  09:18  npm install                      824 tk   cd prepend (npm-wrong-dir)
  5  09:22  find . -name "*.rs"              387 tk   RTK rewrite (output truncation)
  6  09:25  cat src/main.rs                  249 tk   RTK rewrite (lean-ctx wrap)
  7  09:31  cargo clippy                     534 tk   cd prepend (cargo-wrong-dir)
  ...

Pillar Breakdown:
  Pillar 1 (context resolution):   <span data-stat="session_p1_tokens">3,204</span> tokens  <span data-stat="session_p1_pct">36.6</span>%
  Pillar 2 (GDB debugging):            0 tokens   0.0%
  Pillar 3 (mined preventions):        0 tokens   0.0%
  Pillar 4 (automation skills):    <span data-stat="session_p4_tokens">1,560</span> tokens  <span data-stat="session_p4_pct">17.8</span>%
  RTK rewrites:                    <span data-stat="session_rtk_tokens">2,749</span> tokens  <span data-stat="session_rtk_pct">31.5</span>%
  Lean-ctx wraps:                  <span data-stat="session_lean_tokens">1,228</span> tokens  <span data-stat="session_lean_pct">14.1</span>%

Jak se odhadují úspory

Každý typ korekce má odhadovanou cenu v tokenech na základě toho, co by se stalo bez PRECC:

Typ korekceOdhadované úsporyOdůvodnění
cd prepend~500 tokensChybový výstup + Claudovo uvažování + opakování
Aktivace dovednosti~400 tokensChybový výstup + Claudovo uvažování + opakování
RTK rewrite~250 tokensRozvláčný výstup, který by Claude musel přečíst
Lean-ctx wrap~600 tokensObsah velkých souborů komprimován
Naučená prevence~500 tokensZnámý vzor chyby se vyhnul

Jedná se o konzervativní odhady. Skutečné úspory jsou často vyšší, protože Claudovo uvažování o chybách může být rozvláčné.

Kumulativní úspory

Úspory přetrvávají napříč relacemi v databázi PRECC. Postupem času můžete sledovat celkový dopad:

$ precc savings
Session Token Savings
=====================
Total estimated savings: <span data-stat="session_tokens_saved">8,741</span> tokens

Lifetime savings: <span data-stat="total_tokens_saved">142,389</span> tokens across <span data-stat="total_sessions">47</span> sessions

Stavový řádek

Po instalaci PRECC zapíše do ~/.claude/settings.json položku statusLine, aby stavový řádek Claude Code zobrazoval živé metriky relace:

$0.42 spent | 1.2M in/out | 📊 last cmd: −1.2K | PRECC: 7 fixes | 5.8ms avg | this session: 320 saved over 7 cmds (~$0.05) | lifetime: 8.9K saved over 217 cmds (~$2.85)

Nastavte PRECC_LANG, aby se popisky zobrazovaly ve vašem jazyce — viz kapitola Lokalizace.

Každý segment:

SegmentZdrojVýznamResetuje se při restartu relace?
$0.42 spentcost.total_cost_usdKumulativní náklady relace hlášené Claude CodeAno
1.2M in/outtotal_input_tokens + total_output_tokensNecachované vstupní + výstupní tokeny v rámci relaceAno
📊 last cmd: −1.2KMěření PRECC posledního příkazu BashSkutečná naměřená úspora z opětovného spuštění původního příkazuNe (zachovává se mezi relacemi)
PRECC: 7 fixesmetrics.logPočet oprav v této relaci — pouze počet, žádný falešný odhad tokenůAno
5.8ms avgLatence háčku PRECC p50Čas, který PRECC strávil zpracováním každého volání nástrojeAno
bash 18% of totalpost_observations.logPodíl tokenů relace pocházejících z výstupu Bash — vysvětluje, proč jsou úspory PRECC přirozeně zlomkem celkových nákladů (PRECC optimalizuje pouze výstup Bash)Ano
this session: 320 saved over 7 cmds (~$0.05).lifetime_summary.json − baselineSkutečná delta na relaci. Skryta, když je delta nula (začátek relace)Ano (základní linie se znovu pořizuje)
lifetime: 8.9K saved over 217 cmds (~$2.85).lifetime_summary.jsonKumulativně ušetřené tokeny a znovu změřené příkazy od první instalace PRECC, plus odhadovaná hodnota v USD při aktuální sazbě za tokenNe

Segment lifetime: je umístěn jako poslední, aby byl první oříznut, pokud rozhraní Claude Code ořízne lištu na pravém okraji.

Proč se náklady a počet tokenů nedělí

Zobrazené 1.2M in/out není jmenovatel, který vyprodukoval $0.42 spent. cost.total_cost_usd od Claude Code se počítá z úplného rozpisu tokenů API — základní vstup, výstup, plus čtení z mezipaměti a vytvoření mezipaměti. Kumulativní počty tokenů mezipaměti pro celou relaci nejsou ve schématu statusline vystaveny, takže PRECC může zobrazit pouze viditelnou (necache) část.

V dlouhých relacích s častým opětovným čtením souborů mohou být čtení z mezipaměti 10× vyšší než viditelný počet tokenů. Proto by jejich spárování jako poměru bylo zavádějící — PRECC je místo toho zobrazuje jako nezávislé segmenty.

Proč PRECC nepočítá náklady

Číslo nákladů je autoritativní. PRECC čte cost.total_cost_usd doslovně z JSONu, který Claude Code posílá přes stdin do status příkazu. Je to stejné číslo, které Claude Code účtuje vůči vašemu rozpočtu předplatného/použití. Můžete ho kdykoli ověřit vestavěným lomítkovým příkazem /cost — obě by měly souhlasit.

Co řídí náklady

Pro Claude Opus 4.6:

Token typeStandard (≤200k context)1M context tier
Input$15 / MTok$30 / MTok
Output$75 / MTok$150 / MTok
Cache write$18.75 / MTok$37.50 / MTok
Cache read$1.50 / MTok$3 / MTok

Největšími hnacími faktory v dlouhých relacích jsou obvykle výstupní tokeny (nejdražší typ na token, zejména na úrovni kontextu 1M), opakovaná čtení z mezipaměti (jednotlivě levná, ale rychle se kumulující v mnoha kolech) a vytváření mezipaměti (zapisované jednou za čtení souboru za ~1,25× základní vstupní sazby). PRECC snižuje náklady viditelných tokenů kompresí výstupu Bash (segment 📊 last cmd: zobrazuje úsporu na příkaz), ale nemůže snížit čtení mezipaměti souborů, které již Claude načetl.

Stabilní počty relace

Segment “PRECC: N fixes” počítá události od trvale uloženého začátku relace, zapsaného do ~/.local/share/precc/sessions/<session_id>.start při prvním obnovení statusline každé relace. Díky tomu je počítání monotónní — nemůže klesnout uprostřed relace, i když cost.total_duration_ms při konkrétním obnovení chybí.

Automaticky obnovovaný snímek za celou dobu

Segment lifetime: čte ~/.local/share/precc/.lifetime_summary.json, který se přepisuje při každém měření PostToolUse a při každém volání precc savings. Segment this session: čte stejný lifetime soubor, ale odečítá per-relační základ uložený při prvním obnovení každé relace. Žádné ruční obnovení není potřeba — soubory se aktualizují samy.

Potlačení stavového řádku

Pokud raději zachováte svůj stávající stavový řádek, nastavte si vlastní příkaz statusLine v ~/.claude/settings.json. Instalátor PRECC zjistí vlastní hodnotu a při následných aktualizacích ji nechá být.

Chcete-li potlačit pouze řádek 📊 PRECC na interakci (v additionalContext), nastavte ve svém prostředí shellu PRECC_QUIET=1.

PRECC’s three savings mechanisms each have a counterpart in the recent literature. These are related work — the ideas PRECC’s design draws on. Their reported figures are their measurements, not PRECC’s: PRECC only ever quotes numbers measured on your own machine (see “measured, not estimated”, above).

  • Output/trajectory trimming (PRECC’s diet + bash-output compression) — Reducing Cost of LLM Agents with Trajectory Reduction (AgentDiet), FSE 2026, arXiv:2509.23586. Removes redundant/expired trajectory content post-hoc; reports −39.9–59.7% input tokens. PRECC applies the same idea pre-execution and deterministically (no extra LLM call).
  • Skills as programs (PRECC’s mined + builtin rewrite skills) — Harnessing LLM Agents with Skill Programs, arXiv:2605.17734. Frames reusable agent skills as executable program functions — the same analogy behind PRECC’s command-rewrite skills (a pattern → a deterministic rewrite).
  • Context compression (PRECC’s compress + lean-ctx wrapping) — Compress the Context, Keep the Commitments: A Formal Framework for Verifiable LLM Context Compression, arXiv:2605.17304. Recent work on compressing context without losing required information — the property PRECC’s deterministic, cache-stable rewrites aim to preserve.