नेव्हिगेशन
AI BENCHY
तुलना करा चार्ट्स
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.4 vs Qwen: Qwen3.5-27B

तुलना करा:

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-05

मेट्रिक OpenAI: GPT-5.4 none प्रकाशन: 2026-03-05 Qwen: Qwen3.5-27B none प्रकाशन: 2026-02-24
क्रमांक #44 #41
सरासरी स्कोअर 4.6 4.9
बरोबर चाचण्या
सुसंगतता 8.9 9.0
प्रति निकाल खर्च 1.496 0.297
एकूण खर्च $0.090 $0.015
प्रति प्रयत्न पास दर 44.4% 40.0%
अस्थिर चाचण्या 2 2
common.totalAttempts 45 (15 x 3) 45 (15 x 3)
आउटपुट टोकन्स 1,635 3,035
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 1.46s 1.70s
प्रतिसाद वेळ (कमाल) 2.89s 9.39s
प्रतिसाद वेळ (एकूण) 21.86s 25.55s

स्कोअरनुसार शीर्ष मॉडेल्स

प्रतिसाद वेळ (सरासरी)

स्कोअर विरुद्ध एकूण खर्च

सरासरी स्कोअर vs प्रतिसाद वेळ (सरासरी)

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
OpenAI: GPT-5.4 10.0 7.3 11.1% 1 1.41s 388 0
Qwen: Qwen3.5-27B 4.0 10.0 33.3% 0 796ms 264 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
OpenAI: GPT-5.4 10.0 10.0 0.0% 0 2.89s 291 0
Qwen: Qwen3.5-27B 10.0 1.6 33.3% 1 9.39s 1,461 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
OpenAI: GPT-5.4 9.9 10.0 100.0% 0 1.04s 222 0
Qwen: Qwen3.5-27B 9.9 10.0 100.0% 0 1.43s 243 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
OpenAI: GPT-5.4 4.0 7.2 44.4% 1 1.07s 50 0
Qwen: Qwen3.5-27B 10.0 10.0 0.0% 0 540ms 15 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
OpenAI: GPT-5.4 5.5 10.0 50.0% 0 1.07s 81 0
Qwen: Qwen3.5-27B 4.5 10.0 0.0% 0 815ms 69 0
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
OpenAI: GPT-5.4 4.0 9.8 33.3% 0 1.52s 357 0
Qwen: Qwen3.5-27B 6.3 7.9 55.6% 1 1.37s 680 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 2.75s 246 0
Qwen: Qwen3.5-27B 10.0 10.0 100.0% 0 3.54s 303 0

झटपट तुलना

तुलना जोडी बदला