नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.4 vs Qwen: Qwen3.5-27B

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-03

मेट्रिक GPT-5.4 GPT-5.4 medium प्रकाशन: 2026-03-05 Qwen3.5-27B Qwen3.5-27B medium प्रकाशन: 2026-02-24
स्कोअर 7.9 7.9
क्रमांक #27 #24
विश्वसनीयता 10.0 10.0
सुसंगतता 8.5 8.9
बरोबर चाचण्या
प्रति प्रयत्न पास दर 75.0% 73.3%
अस्थिर चाचण्या 4 3
एकूण रन 60 60
प्रति निकाल खर्च 8.765 4.532
एकूण खर्च $1.140 $0.488
इनपुट किंमत $2.500 / 1M $0.195 / 1M
आउटपुट किंमत $15.000 / 1M $1.560 / 1M
एकूण इनपुट टोकन्स 31,489 39,329
आउटपुट टोकन्स 2,221 2,569
रिझनिंग टोकन्स 68,486 304,894
प्रतिसाद वेळ (सरासरी) 22.31s 60.09s
प्रतिसाद वेळ (कमाल) 100.41s 177.36s
प्रतिसाद वेळ (एकूण) 446.17s 1201.89s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 8.3 10.0 75.0% 0 4.11s 606 240 1,511
Qwen3.5-27B 8.7 7.9 91.7% 1 19.75s 672 569 31,505
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 8.2 6.7 83.3% 1 54.98s 4,686 412 19,995
Qwen3.5-27B 7.0 9.8 50.0% 0 123.86s 5,060 416 64,993
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 10.0 10.0 100.0% 0 20.57s 11,019 301 3,543
Qwen3.5-27B 10.0 10.0 100.0% 0 163.96s 14,946 483 9,991
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 10.0 10.0 100.0% 0 5.32s 7,140 234 804
Qwen3.5-27B 10.0 10.0 100.0% 0 30.26s 7,782 270 16,150
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 5.3 7.2 44.4% 1 74.27s 619 61 34,748
Qwen3.5-27B 5.3 10.0 33.3% 0 79.53s 553 43 52,368
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 4.7 3.1 33.3% 1 4.92s 477 145 321
Qwen3.5-27B 6.1 3.1 66.7% 1 101.41s 524 70 23,147
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 10.0 10.0 100.0% 0 3.11s 660 93 897
Qwen3.5-27B 10.0 10.0 100.0% 0 19.66s 699 97 11,638
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 8.2 7.2 88.9% 1 9.14s 642 441 3,815
Qwen3.5-27B 8.2 7.7 77.8% 1 59.60s 696 242 70,096
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 10.0 10.0 100.0% 0 13.28s 5,445 264 1,031
Qwen3.5-27B 10.0 10.0 100.0% 0 7.45s 8,193 348 1,323
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 3.0 10.0 0.0% 0 13.95s 195 30 1,821
Qwen3.5-27B 3.0 10.0 0.0% 0 85.11s 204 31 23,683

झटपट तुलना

तुलना जोडी बदला