7 fouten die je Claude-sessies onnodig duur maken

Claude Code stuurt bij elke beurt je volledige gespreksgeschiedenis opnieuw op. Een sessie van 30 berichten verbruikt 232.000 tokens. Elke MCP-server, elk bestand dat Claude heeft gelezen, elke instructie die je ooit hebt ingesteld: het reist mee, stilletjes, bij elke prompt.

Veel gebruikers denken dat Claude slechter is geworden. Dat klopt niet. Hun configuratie verbruikt tokens voordat de eerste prompt aankomt.

Dit zijn de zeven fouten die het meest kosten.

Fout 1: Opus gebruiken voor alles

Opus kost vijf keer zoveel per token als Sonnet. Op abonnementsplannen verbruikt het je vijf-uur-venster ruwweg vijf keer sneller. De meeste coderingstaken hebben dat niveau van redeneren niet nodig.

De verdeling die werkt:

Begin elke sessie op Sonnet. Schakel naar Opus alleen als je echt diep redeneren nodig hebt. Schakel naar Haiku voor wegwerpopdrachten. Dit alleen al kan je tokenverbruik halveren.

Voor subagenten: stuur ze naar goedkopere modellen.

export CLAUDE_CODE_SUBAGENT_MODEL="claude-sonnet-4-5-20250929"

Je hoofdsessie draait Opus voor complexe redenering terwijl subagenten gerichte taken op Sonnet afhandelen.

Fout 2: Nooit /compact uitvoeren, of te laat

Elk bericht voegt toe aan je context. Bij bericht 20 herleest Claude bij elke beurt alles vanaf bericht 1. Autocompact treedt standaard in bij ongeveer 95% capaciteit, maar dan is je sessie al opgeblazen.

Stel een vroegere trigger in:

70% voor normaal werk
50% voor ruis-intensieve workflows zoals loganalyse en debuggen

En gebruik aangepaste instructies bij het compacten:

/compact bewaar architectuurbeslissingen, gewijzigde bestanden, falende tests en volgende stappen

Standaard /compact gooit alles gelijkmatig weg. Aangepaste instructies bewaren wat telt en snijden weg wat niet telt.

De timing: compact wanneer het productieve deel van het gesprek duidelijk is, niet wanneer Claude dingen begint te vergeten. Een gezonde sessie produceert een betere samenvatting dan een verslechterde.

Fout 3: MCP-servers geladen die je niet gebruikt

Elke verbonden MCP-server laadt zijn volledige tooldefinities en schema in je context bij elke beurt. Sommige servers voegen 18.000 tokens toe, alleen al door er te zitten.

Stapel vijf servers en dat is 90.000 tokens overhead voordat je eerste prompt aankomt. Elke beurt.

/mcp

Controleer welke servers verbonden zijn. Verwijder alles wat je in deze sessie niet actief gebruikt. Elke verwijderde server bespaart duizenden tokens per beurt.

Een ontwikkelaar vond 160 geregistreerde vaardigheden die 25.000 tokens per aanroep verbruikten. Een ander had een systeemprompt opgeblazen tot 607.000 tokens door geaccumuleerde plugins en MCP-servers. Meer dan de helft van je tools zit er misschien gewoon bij, verbruikt budget en doet niets.

Fout 4: Geen preprocessinghaken voor grote bestanden

Claude die een logbestand van 10.000 regels leest kost duizenden tokens. De meeste regels zijn ruis. Een preprocessinghaak filtert voordat Claude het ziet:

{

"hooks": { "PreToolUse": [ { "matcher": "Bash(cat log)", "hooks": [{ "type": "command", "command": "grep -n 'ERROR\\\\|WARN' $file | head -50" }] } ] } }

Claude ziet 50 relevante regels in plaats van 10.000. Dat is een reductie van 99,5% op loganalyse.

Hetzelfde patroon werkt voor elk groot bestand: filter, knip af of vat samen voordat Claude het verwerkt.

Fout 5: Subagent fan-out op eenvoudige taken

Agentteams gebruiken ongeveer zeven keer meer tokens dan standaardsessies. Elke subagent behoudt zijn eigen contextvenster en draait als een apart Claude-exemplaar.

Voor een grote refactoring over 20 bestanden heeft dat zin. Voor een eenvoudige bugfix heb je zeven keer de tokens verbrand zonder kwaliteitsverbetering.

De regel:

Vage verzoeken zoals “verbeter deze codebase” activeren breed scannen. Claude leest tientallen bestanden, verkent meerdere benaderingen en verbrandt tokens op verkenning die nergens toe leidt. Specifieke verzoeken zoals “voeg invoervalidatie toe aan de inlogfunctie in auth.ts” laten Claude efficiënt werken met minimale bestandslezingen.

Fout 6: Je project elke sessie opnieuw uitleggen

Zonder CLAUDE.md en /memory zijn de eerste drie tot vijf berichten van elke sessie verspild aan setup. “Ik bouw een Next.js-app met Supabase, de authenticatie zit in src/lib/auth/…”

Dat is 3.000 tot 5.000 tokens per sessie besteed aan dingen die Claude al zou moeten weten.

/init

Dit genereert CLAUDE.md vanuit je project. Daarna:

/memory add "projectnaam: MijnApp, stack: Next.js + Supabase, auth: src/lib/auth, database: PostgreSQL"

CLAUDE.md laadt eenmalig bij sessiestart. /memory blijft bestaan tussen sessies. Samen elimineren ze de heruitlegbelasting volledig.

Maar houd CLAUDE.md slank. Een CLAUDE.md van 5.000 tokens kost 5.000 tokens bij elke beurt, elke sessie. Het moet een opzoektabel zijn, geen braindump.

Fout 7: Niet opruimen tussen taken

Een debugsessie afronden en een nieuwe functie starten in dezelfde chat betekent dat Claude alle debugcontext meeneemt: foutlogboeken, stack traces, verkeerde benaderingen. Elk bericht kost nu meer vanwege context die niet langer relevant is.

De twee opdrachten:

/clear

Wist alles, schone lei. Gebruik dit bij volledig wisselen van taak.

/compact

Vat samen en ga verder. Gebruik dit bij dezelfde taak blijven.

Twee verschillende tools voor twee verschillende situaties. /compact gebruiken wanneer je /clear zou moeten gebruiken betekent betalen voor context die je nooit meer nodig hebt.

De regel: nieuwe taak is nieuwe chat. Geen uitzonderingen.

Wat het oplevert

Een ontwikkelaar bijhield wat deze wijzigingen over een maand bespaarden:

Resultaat: 63% minder tokenverbruik. Zelfde outputkwaliteit, zelfde werk gedaan.

De drie wijzigingen die je nu kunt doorvoeren

Als je verder niets doet, doe dan dit:

/model sonnet

Stel je standaardmodel in op Sonnet.

/mcp

Controleer MCP-bloat. Verwijder alles wat je vandaag niet gebruikt.

En voeg de preprocessinghaak voor logbestanden toe aan je settings.json (zie fout 4 hierboven).

Drie wijzigingen. Directe impact op elke sessie daarna.

Veelgestelde vragen

Wanneer is Opus het waard? Bij complexe architectuurbeslissingen waarbij je meerdere systemen tegelijk moet overzien, of bij het debuggen van problemen die meerdere bestanden en lagen omvatten. Voor de meeste dagelijkse taken presteert Sonnet vergelijkbaar bij een fractie van de kosten.

Hoe weet ik wanneer ik moet compacten? Compact wanneer je een duidelijk afgerond blok werk hebt: een functie is klaar, een bug is opgelost, een beslissing is genomen. Wacht niet tot Claude langzamer wordt of dingen vergeet. Dan is het al te laat voor een goede samenvatting.

Hoeveel MCP-servers zijn te veel? Meer dan twee of drie actieve servers in een sessie is bijna altijd te veel. Laad alleen wat je in die specifieke sessie nodig hebt. De rest kun je altijd later toevoegen.

Werkt CLAUDE.md voor alle projecten? Ja. Elke codebase profiteert van een slank CLAUDE.md. Houd het onder de 2.000 tokens: stack, architectuurbeslissingen, conventies en wat Claude nooit moet doen. Meer dan dat wordt zelf een tokenprobleem.

Meer lezen over Claude-gebruik optimaliseren

Claude goed instellen: de complete gids — de basis goed leggen voor efficiënt gebruik
20 Claude-prompts voor dagelijks gebruik — maximale output per sessie
Hoe bouw je een Master Prompt — systeem dat tokens bespaart

7 fouten die je Claude-sessies onnodig duur maken