नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.4 Nano vs Qwen: Qwen3.5 Plus 2026-02-15

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-17

मेट्रिक GPT-5.4 Nano GPT-5.4 Nano medium प्रकाशन: 2026-03-17 Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 none प्रकाशन: 2026-02-15
क्रमांक #28 #39
स्कोअर 7.4 6.8
सुसंगतता 9.0 9.6
प्रति निकाल खर्च 0.769 0.172
एकूण खर्च $0.077 $0.016
बरोबर चाचण्या
प्रति प्रयत्न पास दर 66.7% 54.9%
अस्थिर चाचण्या 2 1
एकूण रन 51 51
आउटपुट टोकन्स 2,474 2,018
रिझनिंग टोकन्स 54,516 0
प्रतिसाद वेळ (सरासरी) 11.08s 2.51s
प्रतिसाद वेळ (कमाल) 94.06s 6.65s
प्रतिसाद वेळ (एकूण) 188.39s 27.60s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Nano 8.3 10.0 75.0% 0 4.52s 683 2,254
Qwen3.5 Plus 2026-02-15 4.8 10.0 25.0% 0 1.91s 517 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Nano 9.8 10.0 100.0% 0 24.13s 349 5,719
Qwen3.5 Plus 2026-02-15 3.0 10.0 0.0% 0 6.65s 314 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Nano 10.0 10.0 100.0% 0 2.54s 234 516
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 1.89s 243 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Nano 5.9 7.2 55.6% 1 38.18s 60 43,325
Qwen3.5 Plus 2026-02-15 5.3 10.0 33.3% 0 1.17s 17 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Nano 4.5 10.0 0.0% 0 4.15s 179 443
Qwen3.5 Plus 2026-02-15 4.4 3.0 33.3% 1 2.26s 117 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Nano 9.8 10.0 100.0% 0 1.88s 95 521
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 1.67s 72 0
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Nano 4.0 7.1 22.2% 1 3.65s 640 1,356
Qwen3.5 Plus 2026-02-15 7.7 10.0 66.7% 0 2.82s 516 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Nano 10.0 10.0 100.0% 0 7.71s 234 382
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 3.33s 222 0

झटपट तुलना

तुलना जोडी बदला