Classement des modèles pour Combiné

Voyez quels modèles d'IA réussissent le mieux sur Combiné, lesquels restent fiables et où les écarts sont les plus marqués.

Modèles affichés

Moyenne de Score Combiné

5.6

Meilleur modèle

Gemini 3.6 Flash 10.0

Raisons d'échec

Avec la raison d'échec Appel d'outil invalide91 Avec la raison d'échec Mauvaise réponse69 Avec la raison d'échec Aucune réponse32 Avec la raison d'échec Erreur API26 Avec la raison d'échec Délai dépassé5 Avec la raison d'échec Mise en forme supplémentaire1 Avec la raison d'échec N'a pas suivi les instructions1

216/216

Rang	Modèle	Entreprise	Score Combiné	Score	Coût total	Tests corrects	Temps de réponse (moy.)
#73	KAT-Coder-Pro V2.5 high	Kwaipilot	7.3	7.2	$0.482	1/2	106.7s
Tests totaux 2 Tests incorrects 1 Coût total $0.482 Temps de réponse (moy.) 106.7s
#80	DeepSeek V3.2 medium	DeepSeek	7.3	7.0	$0.078	1/2	79.9s
Tests totaux 2 Tests incorrects 1 Coût total $0.078 Temps de réponse (moy.) 79.9s
#84	Seed-2.0-Mini medium	Bytedance Seed	7.3	7.0	$0.101	1/2	282.3s
Tests totaux 2 Tests incorrects 1 Coût total $0.101 Temps de réponse (moy.) 282.3s
#114	Ring-2.6-1T medium	Inclusionai	7.3	6.3	$0.103	1/2	257.3s
Tests totaux 2 Tests incorrects 1 Coût total $0.103 Temps de réponse (moy.) 257.3s
#26	Claude Sonnet 5 medium	Anthropic	7.3	8.3	$0.922	1/2	51.9s
Tests totaux 2 Tests incorrects 1 Coût total $0.922 Temps de réponse (moy.) 51.9s
#68	Gemini 3.1 Flash Lite Preview medium	Google	7.2	7.3	$0.115	1/2	16.6s
Tests totaux 2 Tests incorrects 1 Coût total $0.115 Temps de réponse (moy.) 16.6s
#69	Gemini 3.1 Flash Lite medium	Google	7.2	7.3	$0.117	1/2	18.5s
Tests totaux 2 Tests incorrects 1 Coût total $0.117 Temps de réponse (moy.) 18.5s
#60	GPT-5.4 Mini medium	OpenAI	6.9	7.5	$0.756	1/2	59.6s
Tests totaux 2 Tests incorrects 1 Coût total $0.756 Temps de réponse (moy.) 59.6s
#61	Qwen3.5 Plus 2026-02-15 medium	Qwen	6.9	7.5	$0.437	1/2	175.8s
Tests totaux 2 Tests incorrects 1 Coût total $0.437 Temps de réponse (moy.) 175.8s
#72	Kimi K2.6 medium	Moonshot AI	6.9	7.2	$1.036	1/2	458.6s
Tests totaux 2 Tests incorrects 1 Coût total $1.036 Temps de réponse (moy.) 458.6s
#88	MiMo-V2.5-Pro medium	Xiaomi	6.9	6.9	$0.187	1/2	125.4s
Tests totaux 2 Tests incorrects 1 Coût total $0.187 Temps de réponse (moy.) 125.4s
#101	GLM 5.2 none	Z.ai	6.9	6.6	$0.128	1/2	50.2s
Tests totaux 2 Tests incorrects 1 Coût total $0.128 Temps de réponse (moy.) 50.2s
#81	Kimi K2.5 medium	Moonshot AI	6.7	7.0	$0.600	1/2	89.2s
Tests totaux 2 Tests incorrects 1 Coût total $0.600 Temps de réponse (moy.) 89.2s
#82	Mercury 2 medium	Inception	6.7	7.0	$0.093	1/2	7.84s
Tests totaux 2 Tests incorrects 1 Coût total $0.093 Temps de réponse (moy.) 7.84s
#105	Qwen3.6 27B medium	Qwen	6.7	6.5	$0.779	0/2	584.1s
Tests totaux 2 Tests incorrects 2 Coût total $0.779 Temps de réponse (moy.) 584.1s

Classement Combiné

Filtrer les modèles

Meilleurs modèles par Score Combiné

Score Combiné vs coût total

Meilleurs modèles par Temps de réponse (moy.)