नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.4 vs Qwen: Qwen3.5-27B

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-16

मेट्रिक GPT-5.4 GPT-5.4 medium प्रकाशन: 2026-03-05 Qwen3.5-27B Qwen3.5-27B medium प्रकाशन: 2026-02-24
स्कोअर 8.2 8.4
क्रमांक #16 #10
सुसंगतता 8.7 8.8
बरोबर चाचण्या
प्रति प्रयत्न पास दर 79.6% 81.5%
अस्थिर चाचण्या 3 3
एकूण रन 54 54
प्रति निकाल खर्च 6.399 3.822
एकूण खर्च $0.832 $0.497
???? ??? $2.500 / 1M $0.195 / 1M
????? ??? $15.000 / 1M $1.560 / 1M
आउटपुट टोकन्स 2,169 2,500
रिझनिंग टोकन्स 48,732 242,500
प्रतिसाद वेळ (सरासरी) 18.63s 53.03s
प्रतिसाद वेळ (कमाल) 100.41s 163.96s
प्रतिसाद वेळ (एकूण) 335.26s 954.46s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 8.3 10.0 75.0% 0 4.11s 240 1,511
Qwen3.5-27B 8.7 7.9 91.7% 1 19.75s 569 31,505
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 10.0 10.0 100.0% 0 13.03s 389 2,045
Qwen3.5-27B 10.0 10.0 100.0% 0 70.35s 375 19,165
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 10.0 10.0 100.0% 0 20.57s 301 3,543
Qwen3.5-27B 10.0 10.0 100.0% 0 163.96s 483 9,991
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 10.0 10.0 100.0% 0 5.32s 234 804
Qwen3.5-27B 10.0 10.0 100.0% 0 30.26s 270 16,150
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 5.3 7.2 44.4% 1 74.27s 61 34,748
Qwen3.5-27B 5.3 10.0 33.3% 0 79.53s 43 52,368
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 4.7 3.1 33.3% 1 4.92s 145 321
Qwen3.5-27B 6.1 3.1 66.7% 1 101.41s 70 23,147
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 10.0 10.0 100.0% 0 3.11s 93 897
Qwen3.5-27B 10.0 10.0 100.0% 0 19.66s 97 11,638
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 8.2 7.2 88.9% 1 9.13s 442 3,832
Qwen3.5-27B 8.2 7.7 77.8% 1 64.61s 245 77,213
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 10.0 10.0 100.0% 0 13.28s 264 1,031
Qwen3.5-27B 10.0 10.0 100.0% 0 7.45s 348 1,323

झटपट तुलना

तुलना जोडी बदला