नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.4 Mini vs Qwen: Qwen3.5-Flash

सारांश

GPT-5.4 Mini vs Qwen3.5-Flash benchmark तुलना: GPT-5.4 Mini average score मध्ये पुढे आहे: 8.0 vs 6.8. Qwen3.5-Flash चा benchmark खर्च कमी आहे: $0.080 vs $0.526. GPT-5.4 Mini वेगवान आहे: 22.34s vs 63.29s, pass rates 73.0% vs 71.4%.

शिफारस केलेले मॉडेल: GPT-5.4 Mini - It has the best score here (8.0), while responding about 2.8x faster than Qwen3.5-Flash.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-18

मेट्रिक GPT-5.4 Mini GPT-5.4 Mini medium प्रकाशन: 2026-03-17 Qwen3.5-Flash Qwen3.5-Flash medium प्रकाशन: 2026-02-24
स्कोअर 8.0 6.8
क्रमांक #27 #70
विश्वसनीयता 10.0 10.0
सुसंगतता 8.0 8.1
बरोबर चाचण्या
प्रति प्रयत्न पास दर 73.0% 71.4%
अस्थिर चाचण्या 5 5
एकूण रन 63 63
प्रति निकाल खर्च 4.381 0.871
एकूण खर्च $0.526 $0.080
इनपुट किंमत $0.750 / 1M $0.065 / 1M
आउटपुट किंमत $4.500 / 1M $0.260 / 1M
एकूण इनपुट टोकन्स 34,116 38,926
आउटपुट टोकन्स 2,181 2,088
रिझनिंग टोकन्स 108,937 294,598
प्रतिसाद वेळ (सरासरी) 22.34s 63.29s
प्रतिसाद वेळ (कमाल) 138.75s 234.29s
प्रतिसाद वेळ (एकूण) 469.20s 1265.85s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#27 GPT-5.4 Mini

medium
खर्च
$0.056
वेळ
95.5s
टोकन्स
12,464 tok

#70 Qwen3.5-Flash

medium
खर्च
$0.002
वेळ
25.8s
टोकन्स
4,294 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 8.6 7.9 91.7% 1 4.05s 606 296 2,876
Qwen3.5-Flash 10.0 10.0 100.0% 0 59.11s 672 383 32,992
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 8.4 7.4 88.9% 1 57.87s 7,305 467 40,902
Qwen3.5-Flash 3.7 7.2 22.2% 1 58.87s 6,685 302 90,081
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 10.0 10.0 100.0% 0 17.81s 11,019 317 4,317
Qwen3.5-Flash 10.0 10.0 100.0% 0 17.78s 14,934 483 8,270
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 10.0 10.0 100.0% 0 2.43s 7,140 234 650
Qwen3.5-Flash 7.3 5.9 83.3% 1 56.99s 6,061 235 16,237
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 4.1 4.4 44.5% 2 65.31s 619 60 43,286
Qwen3.5-Flash 5.3 7.2 44.4% 1 146.50s 581 58 43,615
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 4.5 10.0 0.0% 0 3.72s 477 150 510
Qwen3.5-Flash 6.1 3.1 66.7% 1 40.05s 516 99 38,486
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 9.8 10.0 100.0% 0 2.13s 660 96 1,185
Qwen3.5-Flash 10.0 10.0 100.0% 0 63.49s 699 98 14,139
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 7.8 10.0 66.7% 0 4.37s 642 278 2,443
Qwen3.5-Flash 8.2 7.2 88.9% 1 27.61s 381 89 12,457
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 4.7 1.6 66.7% 1 9.62s 5,453 251 2,594
Qwen3.5-Flash 10.0 10.0 100.0% 0 10.33s 8,193 309 1,284
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 3.0 10.0 0.0% 0 30.10s 195 32 10,174
Qwen3.5-Flash 3.0 10.0 0.0% 0 48.98s 204 32 37,037

झटपट तुलना

तुलना जोडी बदला