नेव्हिगेशन
AI BENCHY
तुलना करा चार्ट्स Paddhati
❤️ Made by XCS
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.3 Chat vs Qwen: Qwen3.5-27B

तुलना करा:

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-06

मेट्रिक OpenAI: GPT-5.3 Chat none प्रकाशन: 2026-03-03 Qwen: Qwen3.5-27B medium प्रकाशन: 2026-02-24
क्रमांक #19 #7
सरासरी स्कोअर 7.3 8.2
सुसंगतता 8.5 9.1
प्रति निकाल खर्च 3.163 3.585
एकूण खर्च $0.317 $0.431
बरोबर चाचण्या
प्रति प्रयत्न पास दर 70.8% 81.3%
अस्थिर चाचण्या 3 2
एकूण रन 48 (16 x 3) 48 (16 x 3)
आउटपुट टोकन्स 19,272 1,658
रिझनिंग टोकन्स 0 200,786
प्रतिसाद वेळ (सरासरी) 5.96s 52.13s
प्रतिसाद वेळ (कमाल) 18.33s 163.96s
प्रतिसाद वेळ (एकूण) 95.30s 834.16s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

सरासरी स्कोअर vs प्रतिसाद वेळ (सरासरी)

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
OpenAI: GPT-5.3 Chat 7.3 7.5 77.8% 1 4.72s 3,091 0
Qwen: Qwen3.5-27B 10.0 10.0 100.0% 0 9.69s 102 8,956
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
OpenAI: GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 2,614 0
Qwen: Qwen3.5-27B 10.0 10.0 100.0% 0 163.96s 483 9,991
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
OpenAI: GPT-5.3 Chat 9.9 10.0 100.0% 0 2.21s 942 0
Qwen: Qwen3.5-27B 9.9 10.0 100.0% 0 30.26s 270 16,150
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
OpenAI: GPT-5.3 Chat 10.0 4.4 33.3% 2 13.01s 8,264 0
Qwen: Qwen3.5-27B 4.0 10.0 33.3% 0 79.53s 43 52,368
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
OpenAI: GPT-5.3 Chat 4.0 10.0 0.0% 0 1.99s 319 0
Qwen: Qwen3.5-27B 5.0 3.1 66.7% 1 101.41s 70 23,147
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
OpenAI: GPT-5.3 Chat 9.0 10.0 50.0% 0 3.29s 1,455 0
Qwen: Qwen3.5-27B 10.0 10.0 100.0% 0 19.66s 97 11,638
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
OpenAI: GPT-5.3 Chat 10.0 10.0 100.0% 0 2.93s 1,726 0
Qwen: Qwen3.5-27B 8.3 7.7 77.8% 1 64.61s 245 77,213
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
OpenAI: GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 861 0
Qwen: Qwen3.5-27B 10.0 10.0 100.0% 0 7.45s 348 1,323

झटपट तुलना

तुलना जोडी बदला