नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.3 Chat vs Qwen: Qwen3.5 Plus 2026-02-15

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-29

मेट्रिक GPT-5.3 Chat GPT-5.3 Chat none प्रकाशन: 2026-03-03 Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 medium प्रकाशन: 2026-02-15
स्कोअर 7.7 8.5
क्रमांक #48 #12
विश्वसनीयता लागू नाही लागू नाही
सुसंगतता 8.6 9.1
बरोबर चाचण्या
प्रति प्रयत्न पास दर 68.5% 83.3%
अस्थिर चाचण्या 3 2
एकूण रन 54 54
प्रति निकाल खर्च 3.082 1.566
एकूण खर्च $0.340 $0.220
???? ??? $1.750 / 1M $0.260 / 1M
????? ??? $14.000 / 1M $1.560 / 1M
आउटपुट टोकन्स 20,784 2,121
रिझनिंग टोकन्स 0 111,889
प्रतिसाद वेळ (सरासरी) 5.88s 46.56s
प्रतिसाद वेळ (कमाल) 18.33s 120.91s
प्रतिसाद वेळ (एकूण) 105.90s 512.20s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3 Chat 6.7 8.1 58.3% 1 3.86s 3,167 0
Qwen3.5 Plus 2026-02-15 8.2 7.9 83.3% 1 45.78s 205 21,236
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3 Chat 10.0 10.0 100.0% 0 9.32s 1,436 0
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 120.91s 367 19,367
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 2,614 0
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 46.85s 421 7,906
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.21s 942 0
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 46.91s 270 14,916
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3 Chat 3.5 4.4 33.3% 2 13.01s 8,264 0
Qwen3.5 Plus 2026-02-15 5.3 10.0 33.3% 0 17.50s 35 16,680
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3 Chat 4.6 10.0 0.0% 0 1.99s 319 0
Qwen3.5 Plus 2026-02-15 4.7 1.6 66.7% 1 79.86s 73 8,675
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3 Chat 8.3 10.0 50.0% 0 3.29s 1,455 0
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 31.93s 101 7,704
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.93s 1,726 0
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 34.57s 340 14,496
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 861 0
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 7.54s 309 909

झटपट तुलना

तुलना जोडी बदला