Úspory

PRECC sleduje odhadované úspory tokenů z každého zachycení. Použijte precc savings pro zobrazení, kolik plýtvání PRECC zabránil.

Rychlý souhrn

$ precc savings
Session Token Savings
=====================
Total estimated savings: <span data-stat="session_tokens_saved">8,741</span> tokens

Breakdown:
  Pillar 1 (cd prepends):         <span data-stat="session_p1_tokens">3,204</span> tokens  (<span data-stat="session_p1_count">6</span> corrections)
  Pillar 4 (skill activations):   <span data-stat="session_p4_tokens">1,560</span> tokens  (<span data-stat="session_p4_count">4</span> activations)
  RTK rewrites:                   <span data-stat="session_rtk_tokens">2,749</span> tokens  (<span data-stat="session_rtk_count">11</span> rewrites)
  Lean-ctx wraps:                 <span data-stat="session_lean_tokens">1,228</span> tokens  (<span data-stat="session_lean_count">2</span> wraps)

Podrobný rozpis (Pro)

$ precc savings --all
Session Token Savings (Detailed)
================================
Total estimated savings: <span data-stat="session_tokens_saved">8,741</span> tokens

Command-by-command:
  #  Time   Command                          Saving   Source
  1  09:12  cargo build                      534 tk   cd prepend (cargo-wrong-dir)
  2  09:14  cargo test                       534 tk   cd prepend (cargo-wrong-dir)
  3  09:15  git status                       412 tk   cd prepend (git-wrong-dir)
  4  09:18  npm install                      824 tk   cd prepend (npm-wrong-dir)
  5  09:22  find . -name "*.rs"              387 tk   RTK rewrite (output truncation)
  6  09:25  cat src/main.rs                  249 tk   RTK rewrite (lean-ctx wrap)
  7  09:31  cargo clippy                     534 tk   cd prepend (cargo-wrong-dir)
  ...

Pillar Breakdown:
  Pillar 1 (context resolution):   <span data-stat="session_p1_tokens">3,204</span> tokens  <span data-stat="session_p1_pct">36.6</span>%
  Pillar 2 (GDB debugging):            0 tokens   0.0%
  Pillar 3 (mined preventions):        0 tokens   0.0%
  Pillar 4 (automation skills):    <span data-stat="session_p4_tokens">1,560</span> tokens  <span data-stat="session_p4_pct">17.8</span>%
  RTK rewrites:                    <span data-stat="session_rtk_tokens">2,749</span> tokens  <span data-stat="session_rtk_pct">31.5</span>%
  Lean-ctx wraps:                  <span data-stat="session_lean_tokens">1,228</span> tokens  <span data-stat="session_lean_pct">14.1</span>%

Jak se odhadují úspory

Každý typ korekce má odhadovanou cenu v tokenech na základě toho, co by se stalo bez PRECC:

Typ korekce	Odhadované úspory	Odůvodnění
cd prepend	~500 tokens	Chybový výstup + Claudovo uvažování + opakování
Aktivace dovednosti	~400 tokens	Chybový výstup + Claudovo uvažování + opakování
RTK rewrite	~250 tokens	Rozvláčný výstup, který by Claude musel přečíst
Lean-ctx wrap	~600 tokens	Obsah velkých souborů komprimován
Naučená prevence	~500 tokens	Známý vzor chyby se vyhnul

Jedná se o konzervativní odhady. Skutečné úspory jsou často vyšší, protože Claudovo uvažování o chybách může být rozvláčné.

Kumulativní úspory

Úspory přetrvávají napříč relacemi v databázi PRECC. Postupem času můžete sledovat celkový dopad:

$ precc savings
Session Token Savings
=====================
Total estimated savings: <span data-stat="session_tokens_saved">8,741</span> tokens

Lifetime savings: <span data-stat="total_tokens_saved">142,389</span> tokens across <span data-stat="total_sessions">47</span> sessions

Stavový řádek

Po instalaci PRECC zapíše do ~/.claude/settings.json položku statusLine, aby stavový řádek Claude Code zobrazoval živé metriky relace:

$0.42 spent | 1.2M in/out | 📊 last cmd: −1.2K | PRECC: 7 fixes | 5.8ms avg | this session: 320 saved over 7 cmds (~$0.05) | lifetime: 8.9K saved over 217 cmds (~$2.85)

Nastavte PRECC_LANG, aby se popisky zobrazovaly ve vašem jazyce — viz kapitola Lokalizace.

Každý segment:

Segment	Zdroj	Význam	Resetuje se při restartu relace?
`$0.42 spent`	`cost.total_cost_usd`	Kumulativní náklady relace hlášené Claude Code	Ano
`1.2M in/out`	`total_input_tokens + total_output_tokens`	Necachované vstupní + výstupní tokeny v rámci relace	Ano
`📊 last cmd: −1.2K`	Měření PRECC posledního příkazu Bash	Skutečná naměřená úspora z opětovného spuštění původního příkazu	Ne (zachovává se mezi relacemi)
`PRECC: 7 fixes`	`metrics.log`	Počet oprav v této relaci — pouze počet, žádný falešný odhad tokenů	Ano
`5.8ms avg`	Latence háčku PRECC p50	Čas, který PRECC strávil zpracováním každého volání nástroje	Ano
`bash 18% of total`	`post_observations.log`	Podíl tokenů relace pocházejících z výstupu Bash — vysvětluje, proč jsou úspory PRECC přirozeně zlomkem celkových nákladů (PRECC optimalizuje pouze výstup Bash)	Ano
`this session: 320 saved over 7 cmds (~$0.05)`	`.lifetime_summary.json` − baseline	Skutečná delta na relaci. Skryta, když je delta nula (začátek relace)	Ano (základní linie se znovu pořizuje)
`lifetime: 8.9K saved over 217 cmds (~$2.85)`	`.lifetime_summary.json`	Kumulativně ušetřené tokeny a znovu změřené příkazy od první instalace PRECC, plus odhadovaná hodnota v USD při aktuální sazbě za token	Ne

Segment lifetime: je umístěn jako poslední, aby byl první oříznut, pokud rozhraní Claude Code ořízne lištu na pravém okraji.

Proč se náklady a počet tokenů nedělí

Zobrazené 1.2M in/out není jmenovatel, který vyprodukoval $0.42 spent. cost.total_cost_usd od Claude Code se počítá z úplného rozpisu tokenů API — základní vstup, výstup, plus čtení z mezipaměti a vytvoření mezipaměti. Kumulativní počty tokenů mezipaměti pro celou relaci nejsou ve schématu statusline vystaveny, takže PRECC může zobrazit pouze viditelnou (necache) část.

V dlouhých relacích s častým opětovným čtením souborů mohou být čtení z mezipaměti 10× vyšší než viditelný počet tokenů. Proto by jejich spárování jako poměru bylo zavádějící — PRECC je místo toho zobrazuje jako nezávislé segmenty.

Proč PRECC nepočítá náklady

Číslo nákladů je autoritativní. PRECC čte cost.total_cost_usd doslovně z JSONu, který Claude Code posílá přes stdin do status příkazu. Je to stejné číslo, které Claude Code účtuje vůči vašemu rozpočtu předplatného/použití. Můžete ho kdykoli ověřit vestavěným lomítkovým příkazem /cost — obě by měly souhlasit.

Co řídí náklady

Pro Claude Opus 4.6:

Token type	Standard (≤200k context)	1M context tier
Input	$15 / MTok	$30 / MTok
Output	$75 / MTok	$150 / MTok
Cache write	$18.75 / MTok	$37.50 / MTok
Cache read	$1.50 / MTok	$3 / MTok

Největšími hnacími faktory v dlouhých relacích jsou obvykle výstupní tokeny (nejdražší typ na token, zejména na úrovni kontextu 1M), opakovaná čtení z mezipaměti (jednotlivě levná, ale rychle se kumulující v mnoha kolech) a vytváření mezipaměti (zapisované jednou za čtení souboru za ~1,25× základní vstupní sazby). PRECC snižuje náklady viditelných tokenů kompresí výstupu Bash (segment 📊 last cmd: zobrazuje úsporu na příkaz), ale nemůže snížit čtení mezipaměti souborů, které již Claude načetl.

Stabilní počty relace

Segment “PRECC: N fixes” počítá události od trvale uloženého začátku relace, zapsaného do ~/.local/share/precc/sessions/<session_id>.start při prvním obnovení statusline každé relace. Díky tomu je počítání monotónní — nemůže klesnout uprostřed relace, i když cost.total_duration_ms při konkrétním obnovení chybí.

Automaticky obnovovaný snímek za celou dobu

Segment lifetime: čte ~/.local/share/precc/.lifetime_summary.json, který se přepisuje při každém měření PostToolUse a při každém volání precc savings. Segment this session: čte stejný lifetime soubor, ale odečítá per-relační základ uložený při prvním obnovení každé relace. Žádné ruční obnovení není potřeba — soubory se aktualizují samy.

Potlačení stavového řádku

Pokud raději zachováte svůj stávající stavový řádek, nastavte si vlastní příkaz statusLine v ~/.claude/settings.json. Instalátor PRECC zjistí vlastní hodnotu a při následných aktualizacích ji nechá být.

Chcete-li potlačit pouze řádek 📊 PRECC na interakci (v additionalContext), nastavte ve svém prostředí shellu PRECC_QUIET=1.

PRECC’s three savings mechanisms each have a counterpart in the recent literature. These are related work — the ideas PRECC’s design draws on. Their reported figures are their measurements, not PRECC’s: PRECC only ever quotes numbers measured on your own machine (see “measured, not estimated”, above).

Output/trajectory trimming (PRECC’s diet + bash-output compression) — Reducing Cost of LLM Agents with Trajectory Reduction (AgentDiet), FSE 2026, arXiv:2509.23586. Removes redundant/expired trajectory content post-hoc; reports −39.9–59.7% input tokens. PRECC applies the same idea pre-execution and deterministically (no extra LLM call).
Skills as programs (PRECC’s skvm pass pipeline + mined/builtin skills) — SkVM: Revisiting Language VM for Skills across Heterogeneous LLMs and Harnesses (Chen et al., SJTU-IPADS), arXiv:2604.03088. Treats agent skills as compiled programs — capability-based compilation and code solidification — reporting up to −40% tokens. PRECC’s skvm module implements this deterministically in the pre-execution hook: a HookIR run through capability-typed passes with a solidification cache. A follow-up, SkillSmith (arXiv:2605.15215), pushes the idea to boundary-guided runtime interfaces (−57% tokens).
Context compression (PRECC’s compress + lean-ctx wrapping) — Compress the Context, Keep the Commitments: A Formal Framework for Verifiable LLM Context Compression, arXiv:2605.17304. Recent work on compressing context without losing required information — the property PRECC’s deterministic, cache-stable rewrites aim to preserve.

Keyboard shortcuts

PRECC User Guide