
Das eigene Defekt-Profil von KI-Code — warum grüne Tests nicht mehr reichen
Zwei Production-Audits zeigen: AI-Code hat ein eigenes Defekt-Profil. Funktionale Korrektheit ist nicht das Problem — Architektur ist es.

Zwei Production-Audits zeigen: AI-Code hat ein eigenes Defekt-Profil. Funktionale Korrektheit ist nicht das Problem — Architektur ist es.

Two production audits reveal: AI-generated code has its own defect profile. Functional correctness is not the problem — architecture is.

Warum persistierte Halluzination in Agent-Memory fundamental anderes Problem ist als Generation-Halluzination — und welche Governance-Infrastruktur sich gerade formiert.

Why persistent hallucination in agent memory is a fundamentally different problem from generation hallucination — and which governance infrastructure is forming right now.

Park et al. haben 2023 eine LLM-Agent-Architektur gebaut, die Tulvings episodisches Gedächtnismodell präzise umsetzt — ohne ihn je zu zitieren.

Park et al. built an LLM-agent architecture in 2023 that precisely implements Tulving's episodic memory taxonomy — without ever citing him.

Ein persönlicher Einstieg für alle, die mit Claude noch nichts zu tun hatten — mit Alltagsbeispielen und ehrlichen Warnungen.

A personal beginner's guide to Claude — with everyday examples and honest warnings for anyone new to AI chat assistants.

Vier Memory-Benchmarks, eine Full-Context-Obergrenze von 72.9% und ein ICLR-2026-Paper, das Memory zurück in die Modellgewichte holt.

Four memory benchmarks, a full-context ceiling of 72.9%, and an ICLR 2026 paper that pulls memory back into the model weights.

Wie ich 84% meines gelöschten Blog-Repos mit Claude Codes JSONL-Logs, Git-Reflog, Publii-SQL und drei weiteren Quellen rekonstruiert habe.

How I recovered 84% of my deleted blog repo using Claude Code's JSONL logs, Git reflog, Publii SQLite, and three other sources.

Vier Shifts — IDE wird optional, Browser kommt zu Claude, Skills ersetzen Prompts, Session-Mining als Gedächtnis — die Claude Code zur Arbeitsumgebung machen.

Four shifts that turn Claude Code from a tool into a working environment — and what they mean for how you think, not just how you work.

Von Bartletts Konfabulation bis Ebbinghaus' Vergessenskurve — sechs kognitive Modelle, direkt gemappt auf LLMs und Agent-Memory-Architekturen.

From Bartlett's confabulation to Ebbinghaus's forgetting curve — six cognitive models mapped onto LLMs and agent memory architectures.

Jeder LLM-API-Call ist ein Clean Slate — 8 Memory-Architekturen im Vergleich: Context Window, RAG, MemGPT, Mem0, Zep, LangGraph und File-basierte Ansätze.

Remote Control Bugs, Channels Sicherheitsrisiken und warum bessere Desktop-Workflows mehr bringen als Smartphone-Zugriff — ein Power-User-Erfahrungsbericht.

Why the "Desk Tax" is a myth for power users — and what Claude Code actually needs instead of mobile access.

Every LLM API call is a clean slate — 8 memory architectures compared: context windows, RAG, MemGPT, Mem0, Zep, LangGraph, and file-based approaches.

Yanli Lius Desk-Tax-Analyse stimmt — aber nur für Gelegenheitsnutzer. Für Power-User mit parallelen Instanzen sind Token-Budgets das eigentliche Limit.

Why Claude Code's idle capacity problem only applies to one user segment — and the security risks nobody's talking about

What changed since January: session-mining, browser feedback loops, parallel instances. Why deeper integration beats adding more tools.

Browser DevTools MCPs, ContextMine, Session-Mining und parallele Instanzen — was sich seit Januar verändert hat und warum tiefere Integration mehr bringt als mehr Tools.

651 Commits, 233 Dokumente, 0 Zeilen Code. Drei Erkenntnisse: sprachagnostische Specs, Hybrid-Validierung und warum "fertig" ein Mythos ist.

651 commits, 233 documents, zero production code. Three lessons: language-agnostic specs, hybrid validation, and why "done" is a myth.

153 Commits in 10 Tagen zeigen, wie sich SDD organisch entwickelt — vom Feature-Blitz über Pattern-Konsolidierung bis zur Konsistenz 9.8/10.

153 commits, 102 specs, 4 phases — and a realization on day 5 that I'd accidentally invented Spec-Driven Development. An authentic journey.

Gezwungener Wechsel von DDD zu SDD: Wie strukturierte Spezifikationen das Chaos von Vibe Coding lösen — mit GitHub Spec-Kit und Thoughtworks-Prinzipien.

AI agents generate code fast — but without structured specs, projects drown in tech debt. Here's how Spec-Driven Development fixes that.

Nach drei Monaten und $6.000 API-Kosten — was bleibt: Handover-Patterns, Quality Gates und der Übergang zu Claude Code.

Over-Engineering, Mode Drift, Context-Overflow — echte Probleme und Lösungen aus der Entwicklung eines Multi-Agent-Systems mit 15 KI-Modi.

Wie Handover-Patterns, Quality Gates und eine Rule Hierarchy 15 spezialisierte AI-Modi zu einem orchestrierten Agile Development Team koordinieren.

From 118 commits in three days to a pragmatic pivot — the final chapter of building an AI development team.

Erzwungener Wechsel von JetBrains zu VSCode wurde zum Wendepunkt — 15 spezialisierte AI-Modi, 118 Commits in 3 Tagen, ein selbst-organisierendes Entwicklungsteam.

Over-engineering, mode drift, context overflow — real problems and solutions from building a 15-mode AI development team.

Language Server, Superpowers, Context7 und v2.1.0 Security-Fix — meine essentiellen Tools nach 3 Monaten intensiver Nutzung.

Language servers, Superpowers, Context7, and the v2.1.0 security fix — my essential tools after 3 months of intensive use.

How I built an AI development team that coordinates like a real agile squad — with zero information loss between 15 specialized modes.

A forced VSCode migration sparked the creation of a complete AI development team with 15 specialized modes — 118 commits in 3 days, a self-organizing system.

How metacognition transforms reactive chatbots into adaptive, self-improving AI systems

Warum GPT-3.5 den Bat-Ball-Test versagt, GPT-4 mit Chain-of-Thought aber besteht — und wie TRAP, Reflexion und LATS KI-Agenten das Lernen aus Fehlern beibringen.