Prix d'entrée
$0.320 / 1M
Prix de sortie
$3.200 / 1M
Tests instables
5
Les tests instables ont eu des résultats mixtes entre exécutions (au moins une réussite et un échec).
Historique des runs
| Testé le | Score | Fiabilité | Tests corrects | Coût total | Comparer |
|---|---|---|---|---|---|
| 2026-04-27 21:48 Nouveau test ajouté | 7.0 | 10.0 | $0.209 | Exécution actuelle | |
| 2026-04-27 21:31 Première exécution enregistrée | 7.9 | 10.0 | $0.043 | Comparer |
Ce run a utilisé une suite de benchmark différente. Gardez ce changement de suite à l'esprit lorsque vous lisez l'historique.
Graphiques
Choisissez d'abord le premier modèle, puis cliquez sur un second modèle pour ouvrir une page côte à côte.
Score vs Coût total
Temps de réponse (moy.)
Score vs Temps de réponse (moy.)
Total des jetons de sortie
Score vs Total des jetons de sortie
Comparaison rapide
Qwen3.6 27BmediumvsDeepSeek V3.2mediumQwen3.6 27BmediumvsClaude Sonnet 4.6noneQwen3.6 27BmediumvsGPT-5.2mediumQwen3.6 27BmediumvsMiMo-V2-OmnimediumQwen3.6 27BmediumvsQwen3.5-35B-A3BmediumQwen3.6 27BmediumvsGemini 3 Flash PreviewmediumQwen3.6 27BmediumvsGemini 3.1 Pro PreviewmediumQwen3.6 27BmediumvsRing 2.6 1tmediumDisponible gratuitement
Répartition par catégorie
| Catégorie | Score | Cohérence | Tests corrects |
|---|---|---|---|
| Astuces anti-IA | 8.3 | 10.0 | |
| Programmation | 10.0 | 10.0 | |
| Combiné | 7.0 | 3.7 | |
| Analyse et extraction des données | 3.5 | 1.4 | |
| Spécifique au domaine | 2.9 | 7.2 | |
| Intelligence générale | 6.5 | 3.4 | |
| Suivi des instructions | 10.0 | 10.0 | |
| Résolution d'énigmes | 7.7 | 10.0 | |
| Appel d'outils | 10.0 | 10.0 | |
| Culture générale | 3.0 | 10.0 |