AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Catégorie AI BENCHY

Classement Culture générale

Voyez quels modèles d'IA réussissent le mieux sur Culture générale, lesquels restent fiables et où les écarts sont les plus marqués. Trier par: Temps de réponse (moy.) ↓.

Modèles affichés

15

Moyenne de Score Culture générale

2.9

Meilleur modèle

MiMo-V2-Omni 3.0
Rang Modèle Entreprise Score Culture générale Score Tests corrects Temps de réponse (moy.)
#72 GPT-5.5 none OpenAI 3.0 6.7 0/1 5.01s
#53 GPT-5.4 Nano medium OpenAI 3.0 7.3 0/1 4.81s
#61 Claude Sonnet 4.6 none Anthropic 3.0 7.2 0/1 4.67s
#46 GPT-5.3 Chat none OpenAI 3.0 7.6 0/1 4.38s
#94 Qwen3.6 27B none Qwen 3.0 5.8 0/1 4.03s
#112 Kimi K2.5 none Moonshot AI 3.0 5.4 0/1 3.90s
#128 MiMo-V2.5 none Xiaomi 3.0 4.9 0/1 3.89s
#78 GLM 5 none Z.ai 3.0 6.5 0/1 3.62s
#27 Gemini 3.1 Flash Lite medium Google 3.0 7.9 0/1 3.08s
#120 DeepSeek V4 Flash none DeepSeek 3.0 5.2 0/1 3.07s
#25 Gemini 2.5 Flash medium Google 3.0 7.9 0/1 2.76s
#7 Gemini 3 Flash Preview low Google 10.0 8.8 1/1 2.75s
#133 HY3 Preview none Tencent 3.0 4.6 0/1 2.71s
#23 Gemini 3.1 Flash Lite Preview medium Google 3.0 8.0 0/1 2.68s
#80 Mercury 2 medium Inception 3.0 6.3 0/1 2.58s

Meilleurs modèles par Score Culture générale

Score Culture générale vs coût total

Meilleurs modèles par Temps de réponse (moy.)