नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.4 vs Qwen: Qwen3.6 35B A3B

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-22

मेट्रिक GPT-5.4 GPT-5.4 medium प्रकाशन: 2026-03-05 Qwen3.6 35B A3B Qwen3.6 35B A3B medium प्रकाशन: 2026-04-20
स्कोअर 7.9 7.8
क्रमांक #27 #30
विश्वसनीयता 10.0 9.4
सुसंगतता 8.5 9.1
बरोबर चाचण्या
प्रति प्रयत्न पास दर 75.0% 70.4%
अस्थिर चाचण्या 4 2
एकूण रन 60 60
प्रति निकाल खर्च 8.767 1.050
एकूण खर्च $1.140 $0.126
???? ??? $2.500 / 1M $0.150 / 1M
????? ??? $15.000 / 1M $1.000 / 1M
आउटपुट टोकन्स 2,222 18,325
रिझनिंग टोकन्स 68,503 115,750
प्रतिसाद वेळ (सरासरी) 22.31s 17.26s
प्रतिसाद वेळ (कमाल) 100.41s 86.11s
प्रतिसाद वेळ (एकूण) 446.15s 310.77s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 8.3 10.0 75.0% 0 4.11s 240 1,511
Qwen3.6 35B A3B 10.0 10.0 100.0% 0 6.02s 1,154 12,385
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 8.2 6.7 83.3% 1 54.98s 412 19,995
Qwen3.6 35B A3B 6.6 10.0 50.0% 0 59.35s 6,601 22,535
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 10.0 10.0 100.0% 0 20.57s 301 3,543
Qwen3.6 35B A3B 0.0 0.0 0.0% 0 0ms 0 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 10.0 10.0 100.0% 0 5.32s 234 804
Qwen3.6 35B A3B 10.0 10.0 100.0% 0 12.99s 2,591 9,968
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 5.3 7.2 44.4% 1 74.27s 61 34,748
Qwen3.6 35B A3B 5.3 7.2 44.4% 1 22.50s 6,193 39,116
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 4.7 3.1 33.3% 1 4.92s 145 321
Qwen3.6 35B A3B 4.4 9.9 0.0% 0 8.66s 129 4,569
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 10.0 10.0 100.0% 0 3.11s 93 897
Qwen3.6 35B A3B 10.0 10.0 100.0% 0 7.50s 219 7,404
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 8.2 7.2 88.9% 1 9.13s 442 3,832
Qwen3.6 35B A3B 7.9 7.5 77.8% 1 5.98s 676 9,447
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 10.0 10.0 100.0% 0 13.28s 264 1,031
Qwen3.6 35B A3B 0.0 0.0 0.0% 0 0ms 0 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 3.0 10.0 0.0% 0 13.95s 30 1,821
Qwen3.6 35B A3B 3.0 10.0 0.0% 0 32.90s 762 10,326

झटपट तुलना

तुलना जोडी बदला