2026-05-22
- Neu getestete Modelle: Qwen3.7 Max Benchmark-Abdeckung für Qwen 3.7 Max hinzugefügt.
- Neue Tests hinzugefügt: Neue Coding-Testkategorie hinzugefügt, die sich auf die Fehlersuche in C++-Lösungen konzentriert.
AI BENCHY
Ein einfaches Protokoll für Produkt- und Benchmark-Updates, nach Datum gruppiert. Wir erfassen hier neu getestete Modelle, Re-Tests, Benchmark-Änderungen und ausgelieferte UX-/Produktarbeit.
Changelog-Seite erstellt
Dieses Changelog begann erst nach dem Launch, daher fehlen hier einige ältere Updates.