Navigation
AI BENCHY
Advertise here

AI BENCHY Compare

DeepSeek: DeepSeek V4 Flash vs Qwen: Qwen3.7 Max

Résumé

Comparaison benchmark DeepSeek V4 Flash vs Qwen3.7 Max : Qwen3.7 Max mène au score moyen avec 9.4 vs 8.3. DeepSeek V4 Flash a le coût de benchmark le plus bas avec $0.029 vs $0.523. Qwen3.7 Max est plus rapide avec 16.02s vs 45.85s, avec des taux de réussite de 74.6% vs 88.9%.

Modèle recommandé: DeepSeek V4 Flash - Il offre le meilleur compromis global: score compétitif (8.3), coût inférieur à Qwen3.7 Max et temps de réponse équilibré.

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-06-12

Métrique DeepSeek V4 Flash DeepSeek V4 Flash high Sortie: 2026-04-24 Qwen3.7 Max Qwen3.7 Max medium Sortie: 2026-05-22
Score 8.3 9.4
Rang #26 #4
Fiabilité 10.0 10.0
Cohérence 8.5 9.6
Tests corrects
Taux de réussite par tentative 74.6% 88.9%
Tests instables 4 1
Exécutions totales 63 63
Coût par résultat 0.299 5.517
Coût total $0.029 $0.523
Prix d'entrée $0.098 / 1M $1.250 / 1M
Prix de sortie $0.196 / 1M $3.750 / 1M
Total des jetons d'entrée 39,745 42,360
Jetons de sortie 10,310 2,129
Jetons de raisonnement 123,501 122,959
Temps de réponse (moy.) 45.85s 16.02s
Temps de réponse (max) 218.13s 59.98s
Temps de réponse (total) 962.79s 336.51s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#26 DeepSeek V4 Flash

high
Cost
$0.003
Time
93.1s
Tokens
7,926 tok

#4 Qwen3.7 Max

medium
Cost
$0.017
Time
68.8s
Tokens
4,526 tok

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
DeepSeek V4 Flash 8.3 10.0 75.0% 0 28.51s 540 140 7,770
Qwen3.7 Max 10.0 10.0 100.0% 0 6.36s 672 222 8,742
Programmation Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
DeepSeek V4 Flash 7.8 10.0 66.7% 0 50.60s 7,279 395 34,862
Qwen3.7 Max 10.0 10.0 100.0% 0 35.31s 7,893 423 34,808
Combiné Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
DeepSeek V4 Flash 10.0 10.0 100.0% 0 76.57s 14,016 465 7,347
Qwen3.7 Max 10.0 10.0 100.0% 0 19.60s 14,934 366 8,405
Analyse et extraction des données Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
DeepSeek V4 Flash 10.0 10.0 100.0% 0 28.03s 7,290 201 1,179
Qwen3.7 Max 10.0 10.0 100.0% 0 8.80s 7,782 270 6,254
Spécifique au domaine Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
DeepSeek V4 Flash 4.1 4.4 44.5% 2 100.31s 666 27 59,249
Qwen3.7 Max 5.9 7.2 55.6% 1 24.94s 771 61 31,793
Intelligence générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
DeepSeek V4 Flash 6.1 3.1 66.7% 1 25.15s 471 79 632
Qwen3.7 Max 10.0 10.0 100.0% 0 11.70s 516 135 4,457
Suivi des instructions Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
DeepSeek V4 Flash 10.0 10.0 100.0% 0 15.36s 627 63 1,622
Qwen3.7 Max 10.0 10.0 100.0% 0 7.46s 699 102 5,452
Résolution d'énigmes Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
DeepSeek V4 Flash 8.2 7.2 88.9% 1 26.11s 594 196 1,767
Qwen3.7 Max 10.0 10.0 100.0% 0 8.84s 696 259 8,908
Appel d'outils Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
DeepSeek V4 Flash 10.0 10.0 100.0% 0 74.73s 8,079 228 542
Qwen3.7 Max 10.0 10.0 100.0% 0 6.63s 8,193 267 1,220
Culture générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
DeepSeek V4 Flash 3.0 10.0 0.0% 0 54.46s 183 8,516 8,531
Qwen3.7 Max 3.0 10.0 0.0% 0 33.37s 204 24 12,920

Comparaison rapide

Changer la paire de comparaison