Navigation
AI BENCHY
Comparer Graphiques Méthodologie
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Mini vs OpenAI: GPT-5.4

Comparer:

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-03-06

Métrique ByteDance Seed: Seed-2.0-Mini medium Sortie: 2026-02-14 OpenAI: GPT-5.4 none Sortie: 2026-03-05
Score moy. 7.0 4.6
Rang #24 #45
Tests corrects
Cohérence 9.4 8.9
Coût par résultat 0.261 1.496
Coût total $0.027 $0.090
Taux de réussite par tentative 71.1% 44.4%
Tests instables 1 2
common.totalRuns 45 (15 x 3) 45 (15 x 3)
Jetons de sortie 1,752 1,635
Jetons de raisonnement 54,246 0
Temps de réponse (moy.) 67.46s 1.46s
Temps de réponse (max) 262.83s 2.89s
Temps de réponse (total) 809.49s 21.86s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score moy. vs Temps de réponse (moy.)

Répartition par catégorie

Astuces anti-IA Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
ByteDance Seed: Seed-2.0-Mini 7.0 10.0 66.7% 0 98.99s 354 9,352
OpenAI: GPT-5.4 10.0 7.3 11.1% 1 1.41s 388 0
Combiné Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
ByteDance Seed: Seed-2.0-Mini 10.0 10.0 100.0% 0 262.83s 404 29,806
OpenAI: GPT-5.4 10.0 10.0 0.0% 0 2.89s 291 0
Analyse et extraction des données Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
ByteDance Seed: Seed-2.0-Mini 9.9 10.0 100.0% 0 24.27s 246 2,743
OpenAI: GPT-5.4 9.9 10.0 100.0% 0 1.04s 222 0
Spécifique au domaine Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
ByteDance Seed: Seed-2.0-Mini 10.0 10.0 0.0% 0 0ms 0 0
OpenAI: GPT-5.4 4.0 7.2 44.4% 1 1.07s 50 0
Suivi des instructions Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
ByteDance Seed: Seed-2.0-Mini 10.0 10.0 100.0% 0 17.47s 69 2,050
OpenAI: GPT-5.4 5.5 10.0 50.0% 0 1.07s 81 0
Puzzle Solving Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
ByteDance Seed: Seed-2.0-Mini 7.0 7.2 88.9% 1 25.85s 457 5,060
OpenAI: GPT-5.4 4.0 9.8 33.3% 0 1.52s 357 0
Appel d'outils Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
ByteDance Seed: Seed-2.0-Mini 10.0 10.0 100.0% 0 88.68s 222 5,235
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 2.75s 246 0

Comparaison rapide

Changer la paire de comparaison