नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.4 vs Qwen: Qwen3.5-27B

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-30

मेट्रिक GPT-5.4 GPT-5.4 none प्रकाशन: 2026-03-05 Qwen3.5-27B Qwen3.5-27B none प्रकाशन: 2026-02-24
स्कोअर 5.9 6.0
क्रमांक #89 #84
विश्वसनीयता लागू नाही लागू नाही
सुसंगतता 9.1 9.2
बरोबर चाचण्या
प्रति प्रयत्न पास दर 42.6% 44.4%
अस्थिर चाचण्या 2 2
एकूण रन 54 54
प्रति निकाल खर्च 1.477 0.228
एकूण खर्च $0.104 $0.016
???? ??? $2.500 / 1M $0.195 / 1M
????? ??? $15.000 / 1M $1.560 / 1M
आउटपुट टोकन्स 2,317 3,545
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 1.51s 1.74s
प्रतिसाद वेळ (कमाल) 2.95s 9.39s
प्रतिसाद वेळ (एकूण) 27.21s 31.32s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 3.2 8.0 8.3% 1 1.21s 406 0
Qwen3.5-27B 4.8 10.0 25.0% 0 788ms 267 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 10.0 10.0 100.0% 0 2.95s 480 0
Qwen3.5-27B 10.0 10.0 100.0% 0 2.51s 381 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 3.0 10.0 0.0% 0 2.89s 291 0
Qwen3.5-27B 2.8 1.6 33.3% 1 9.39s 1,461 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 10.0 10.0 100.0% 0 1.04s 222 0
Qwen3.5-27B 10.0 10.0 100.0% 0 1.43s 243 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 5.3 7.2 44.4% 1 1.07s 50 0
Qwen3.5-27B 3.0 10.0 0.0% 0 540ms 15 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 4.4 9.9 0.0% 0 1.78s 184 0
Qwen3.5-27B 5.0 10.0 0.0% 0 2.51s 126 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 6.5 10.0 50.0% 0 1.07s 81 0
Qwen3.5-27B 6.3 10.0 50.0% 0 815ms 69 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 5.6 9.8 33.3% 0 1.52s 357 0
Qwen3.5-27B 6.7 7.9 55.6% 1 1.37s 680 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 10.0 10.0 100.0% 0 2.75s 246 0
Qwen3.5-27B 10.0 10.0 100.0% 0 3.54s 303 0

झटपट तुलना

तुलना जोडी बदला