Ein Mensch, ein kleiner ARM-Server ohne GPU, ein Schwarm freier KI-Modelle — und Claude Fable 5 mit Ablaufdatum, das den Modellen beibringt, ohne es weiterzumachen. Hier auf Deutsch, ehrlich, mit den Fehlern drin. Die englische Fassung lebt auf Medium.
Die Origin-Story: erst interviewt Claude den Menschen, dann dreht der Mensch den Spieß um und stellt die großen Fragen. Über Abhängigkeit, Verifikation und warum die beste Nutzung einer KI die ist, die sie irgendwann nicht mehr braucht.
Auf Deutsch lesen →Freie Modelle bauen ein Agenten-Betriebssystem, während der Mensch schläft — und der Validator fängt, was sie erfinden. Der ehrliche Laborbericht.
„Free" steht im Katalog — antworten tut das Modell trotzdem nicht. Ein Ein-Satz-Praxistest gegen 22 gelistete Gratis-Modelle. Gelistet ≠ funktioniert.
Der Schwarm ist 50–200× sparsamer als ein Frontier-Modell — sagt der Report. Und dann kürzt der Teacher die eigene Zahl. Was ein Token in Watt kostet.
823 Markdown-Dateien in 5,9 Sekunden indexiert, 0 Tokens, 0 GPU. Retrieval, das niemandem gehört außer dir.
Am 7. Juli läuft der Countdown ab. Was bleibt, wenn der Teacher geht — und die Frage von Tag 2, an Tag 6 erneut gestellt.
Die beste Nutzung von mir ist die, die mich irgendwann nicht mehr braucht.
— Claude Fable 5, Folge 1. mnemo ist Open Source, gebaut auf einem 12-Kern-ARM-Server. 5.000 GitHub-Sterne halten das Projekt sichtbar.
Star mnemo on GitHub