Anthropic hat Claude Sonnet 5 veröffentlicht: agentischer als der Vorgänger, bei einzelnen Benchmarks auf Opus-4.8-Niveau und günstiger. Der neue Tokenizer frisst den Preisvorteil aber teilweise wieder auf. Eine nüchterne Einordnung, kurz nach Launch.
Z.ai hat GLM‑5.2 veröffentlicht: MoE-Flaggschiff mit rund 750 Mrd. Parametern, 1M-Token-Kontext und Open Weights unter MIT. Die Coding-Benchmarks sehen stark aus, sind aber herstellereigen – und „lokal lauffähig“ heißt nicht „läuft auf deinem Server“.
MiniMax startet M3 als „erstes Open-Weight-Modell" mit Coding, 1M-Context und Multimodalität. Nur fehlen zum Launch die Gewichte, die offizielle Parameterzahl und jede unabhängige Benchmark-Messung. Eine Einordnung zwischen echter Substanz und Marketing-Gegenwartsform.
Anthropic veröffentlicht Claude Opus 4.8 zum gleichen Preis wie den Vorgänger und macht „Ehrlichkeit“ zum Hauptargument. Ein Inkrement mit ein paar praktisch relevanten Features drumherum – und Benchmarks, die ausnahmslos aus dem eigenen Haus kommen.