नेव्हिगेशन
AI BENCHY
तुलना करा चार्ट्स
❤️ Made by XCS
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.4 vs Qwen: Qwen3.5-35B-A3B

तुलना करा:

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-05

मेट्रिक OpenAI: GPT-5.4 none प्रकाशन: 2026-03-05 Qwen: Qwen3.5-35B-A3B none प्रकाशन: 2026-02-24
क्रमांक #44 #43
सरासरी स्कोअर 4.6 4.7
बरोबर चाचण्या
सुसंगतता 8.9 8.9
प्रति निकाल खर्च 1.496 0.233
एकूण खर्च $0.090 $0.014
प्रति प्रयत्न पास दर 44.4% 48.9%
अस्थिर चाचण्या 2 2
common.totalAttempts 45 (15 x 3) 45 (15 x 3)
आउटपुट टोकन्स 1,635 3,642
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 1.46s 4.30s
प्रतिसाद वेळ (कमाल) 2.89s 47.43s
प्रतिसाद वेळ (एकूण) 21.86s 64.43s

स्कोअरनुसार शीर्ष मॉडेल्स

प्रतिसाद वेळ (सरासरी)

स्कोअर विरुद्ध एकूण खर्च

सरासरी स्कोअर vs प्रतिसाद वेळ (सरासरी)

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
OpenAI: GPT-5.4 10.0 7.3 11.1% 1 1.41s 388 0
Qwen: Qwen3.5-35B-A3B 10.0 7.2 22.2% 1 1.76s 569 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
OpenAI: GPT-5.4 10.0 10.0 0.0% 0 2.89s 291 0
Qwen: Qwen3.5-35B-A3B 10.0 10.0 0.0% 0 47.43s 1,833 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
OpenAI: GPT-5.4 9.9 10.0 100.0% 0 1.04s 222 0
Qwen: Qwen3.5-35B-A3B 9.9 10.0 100.0% 0 1.16s 243 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
OpenAI: GPT-5.4 4.0 7.2 44.4% 1 1.07s 50 0
Qwen: Qwen3.5-35B-A3B 7.0 10.0 66.7% 0 485ms 15 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
OpenAI: GPT-5.4 5.5 10.0 50.0% 0 1.07s 81 0
Qwen: Qwen3.5-35B-A3B 5.0 10.0 50.0% 0 809ms 63 0
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
OpenAI: GPT-5.4 4.0 9.8 33.3% 0 1.52s 357 0
Qwen: Qwen3.5-35B-A3B 1.7 7.4 22.2% 1 1.34s 655 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 2.75s 246 0
Qwen: Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 2.30s 264 0

झटपट तुलना

तुलना जोडी बदला