नेव्हिगेशन
AI BENCHY
Advertise here

AI BENCHY Compare

OpenAI: GPT-5.4 vs Qwen: Qwen3 Coder Next

सारांश

GPT-5.4 vs Qwen3 Coder Next benchmark तुलना: GPT-5.4 average score मध्ये पुढे आहे: 5.8 vs 5.1. Qwen3 Coder Next चा benchmark खर्च कमी आहे: $0.009 vs $0.122. GPT-5.4 वेगवान आहे: 1.42s vs 8.62s, pass rates 36.5% vs 27.0%.

शिफारस केलेले मॉडेल: GPT-5.4 - It has the best score here (5.8), while responding about 6.1x faster than Qwen3 Coder Next.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-07-02

मेट्रिक GPT-5.4 GPT-5.4 none प्रकाशन: 2026-03-05 Qwen3 Coder Next Qwen3 Coder Next none प्रकाशन: 2026-02-03
स्कोअर 5.8 5.1
क्रमांक #115 #135
विश्वसनीयता 10.0 10.0
सुसंगतता 9.2 9.7
बरोबर चाचण्या
प्रति प्रयत्न पास दर 36.5% 27.0%
अस्थिर चाचण्या 2 1
एकूण रन 63 63
प्रति निकाल खर्च 1.740 0.165
एकूण खर्च $0.122 $0.009
इनपुट किंमत $2.500 / 1M $0.110 / 1M
आउटपुट किंमत $15.000 / 1M $0.800 / 1M
एकूण इनपुट टोकन्स 34,212 47,507
आउटपुट टोकन्स 2,417 3,584
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 1.42s 8.62s
प्रतिसाद वेळ (कमाल) 2.95s 45.14s
प्रतिसाद वेळ (एकूण) 29.87s 129.37s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#115 GPT-5.4

none
खर्च
$0.026
वेळ
18.1s
टोकन्स
1,792 tok

#135 Qwen3 Coder Next

none
अवैध SVG
खर्च
$0.058
वेळ
246.3s
टोकन्स
64,126 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 3.2 8.0 8.3% 1 1.21s 606 406 0
Qwen3 Coder Next 3.6 10.0 0.0% 0 3.31s 645 1,321 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 5.5 10.0 33.3% 0 1.62s 7,305 516 0
Qwen3 Coder Next 4.6 7.9 22.2% 1 2.22s 7,442 621 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 3.0 10.0 0.0% 0 2.89s 11,019 291 0
Qwen3 Coder Next 3.0 10.0 0.0% 0 45.14s 20,469 317 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 10.0 10.0 100.0% 0 1.04s 7,140 222 0
Qwen3 Coder Next 6.5 10.0 50.0% 0 1.32s 7,758 246 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 5.3 7.2 44.4% 1 1.07s 723 50 0
Qwen3 Coder Next 5.3 10.0 33.3% 0 962ms 753 26 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 4.4 9.9 0.0% 0 1.78s 477 184 0
Qwen3 Coder Next 10.0 10.0 100.0% 0 1.34s 498 152 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 6.5 10.0 50.0% 0 1.07s 660 81 0
Qwen3 Coder Next 6.3 10.0 50.0% 0 7.78s 684 63 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 5.6 9.8 33.3% 0 1.44s 642 381 0
Qwen3 Coder Next 3.0 10.0 0.0% 0 24.34s 678 571 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 10.0 10.0 100.0% 0 2.75s 5,445 246 0
Qwen3 Coder Next 10.0 10.0 100.0% 0 2.47s 8,364 255 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 3.0 10.0 0.0% 0 990ms 195 40 0
Qwen3 Coder Next 3.0 10.0 0.0% 0 601ms 216 12 0

झटपट तुलना

तुलना जोडी बदला