AI Picks der 18. KW

Zum Einstieg ins lange Wochenende ein paar Picks mit Links und Neuigkeiten – die Reihenfolge ist rein zufällig gewählt.

Self-Hosted LLMs in the Real World: Limits, Workarounds, and Hard Lessons

Harte operative Hürden, Hardware-Hunger (ja, VRAM), qualitative Einbußen durch Quantisierung, Context-Window-Limits und Latenz – warum lokales Hosting von LLMs derzeit noch sehr kompromissbehaftet ist und durchaus frustrierend sein kann.

Nahla Davies mit einem ziemlich deutlichen Reality-Check darüber, ob der Aufwand des Self-Hostings im Verhältnis zum Nutzen steht oder ob API-Lösungen derzeit noch die bessere Option sind.

You can now easily generate files in Gemini.

Dokumente wurden durchaus schon vorher von Gemini generiert, aber dies funktionierte nur über das Canvas Tool. Wirklich neu ist, dass Dokumente nun direkt aus dem Chat heraus erstellt werden können und als Dateien bereitgestellt werden. Gemini ist jetzt in der Lage, etwa Python-Skripte als .py-Dateien, CSV oder Markdown zu erzeugen und zum Download bereitzustellen.

Die Wettbewerber beherrschen das schon ein wenig länger, aber schön, dass Google endlich nachzieht.

Zed is 1.0

Zed purzelt aus der Beta. Die Macher von Atom und Tree-sitter über die angeblich schnellste IDE des Planeten (keine Ahnung, ob sie das auch selbst behauptet haben). Zed verfolgt den Ansatz von Kollaboration und integrierter KI-Interaktion, statt alte Architekturen mühsam nachzurüsten.

Nathan Sobo über den Release der 1.0, was das bedeutet und auch zum Technik-Stack dahinter.

paperclip – Open-source orchestration for zero-human companies

Das ist jetzt auch ein kleiner Bookmark/Reminder an mich selbst, dringend mal einen Container mit Paperclip aufzusetzen.

Orchestrierungs-Plattform auf Basis von Node.js, die Teams von KI-Agenten verwaltet. Über geplante „Heartbeats“ und persistente Zustände können Agenten Aufgaben über lange Zeiträume hinweg bearbeiten.
Paperclip auf GitHub.

Introducing Mistral Medium 3.5

Mistral 3.5 Medium wurde speziell auf Reasoning und Tool-Use optimiert. Workflows sollen damit nun effizienter orchestriert werden können (cloud-basiert). 3.5 Medium ist ein 28B Modell mit einem 256k Kontext-Fenster. Sie schreiben auch ganz offiziell „flagship model“ darunter.

Quasi angenäht dazu wurde mit Vibe ein Open-Source-Framework veröffentlicht, das die Ausführung von KI-Agenten deutlich vereinfachen soll. Des Pudels Kern: Anstatt rechenintensive Agenten lokal laufen zu lassen, ermöglicht Vibe die Nutzung von Remote Agents.

Interna

Eine weitere Iteration dieses Blog-Themes wird ganz bald durch Claude Code wandern und noch eine kleine Handvoll Bugs beseitigen (ganz bestimmt wird sie das) und ein bis eineinhalb neue Features mit sich bringen. Die beschäftigen sich allerdings eher mit Dingen unter der Haube.