AI BENCHY
Advertise here

Catégorie AI BENCHY

Classement Culture générale

Voyez quels modèles d'IA réussissent le mieux sur Culture générale, lesquels restent fiables et où les écarts sont les plus marqués. Trier par: Temps de réponse (moy.) ↑.

Modèles affichés

15

Moyenne de Score Culture générale

2.9

Rang Modèle Entreprise Score Culture générale Score Tests corrects Temps de réponse (moy.)
#25 Gemini 2.5 Flash medium Google 3.0 7.9 0/1 2.76s
#120 DeepSeek V4 Flash none DeepSeek 3.0 5.2 0/1 3.07s
#27 Gemini 3.1 Flash Lite medium Google 3.0 7.9 0/1 3.08s
#78 GLM 5 none Z.ai 3.0 6.5 0/1 3.62s
#128 MiMo-V2.5 none Xiaomi 3.0 4.9 0/1 3.89s
#112 Kimi K2.5 none Moonshot AI 3.0 5.4 0/1 3.90s
#94 Qwen3.6 27B none Qwen 3.0 5.8 0/1 4.03s
#46 GPT-5.3 Chat none OpenAI 3.0 7.6 0/1 4.38s
#61 Claude Sonnet 4.6 none Anthropic 3.0 7.2 0/1 4.67s
#53 GPT-5.4 Nano medium OpenAI 3.0 7.3 0/1 4.81s
#72 GPT-5.5 none OpenAI 3.0 6.7 0/1 5.01s
#1 Gemini 3 Flash Preview medium Google 10.0 10.0 1/1 5.50s
#107 Mistral Small 4 medium Mistral 3.0 5.5 0/1 5.92s
#2 Gemini 3.1 Pro Preview medium Google 10.0 9.6 1/1 6.27s
#41 GPT-5.2 Chat none OpenAI 3.0 7.6 0/1 6.89s

Meilleurs modèles par Score Culture générale

Score Culture générale vs coût total

Meilleurs modèles par Temps de réponse (moy.)