नेव्हिगेशन
AI BENCHY
तुलना करा चार्ट्स Paddhati
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.4 vs Qwen: Qwen3.5-Flash

तुलना करा:

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-06

मेट्रिक OpenAI: GPT-5.4 none प्रकाशन: 2026-03-05 Qwen: Qwen3.5-Flash none प्रकाशन: 2026-02-24
सरासरी स्कोअर 4.6 4.9
क्रमांक #44 #40
बरोबर चाचण्या
सुसंगतता 8.9 9.5
प्रति निकाल खर्च 1.496 0.088
एकूण खर्च $0.090 $0.006
प्रति प्रयत्न पास दर 44.4% 42.2%
अस्थिर चाचण्या 2 1
common.totalRuns 45 (15 x 3) 45 (15 x 3)
आउटपुट टोकन्स 1,635 3,674
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 1.46s 3.73s
प्रतिसाद वेळ (कमाल) 2.89s 13.73s
प्रतिसाद वेळ (एकूण) 21.86s 55.90s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

सरासरी स्कोअर vs प्रतिसाद वेळ (सरासरी)

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
OpenAI: GPT-5.4 10.0 7.3 11.1% 1 1.41s 388 0
Qwen: Qwen3.5-Flash 2.3 7.8 11.1% 1 1.62s 687 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
OpenAI: GPT-5.4 10.0 10.0 0.0% 0 2.89s 291 0
Qwen: Qwen3.5-Flash 10.0 10.0 0.0% 0 6.22s 1,794 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
OpenAI: GPT-5.4 9.9 10.0 100.0% 0 1.04s 222 0
Qwen: Qwen3.5-Flash 9.9 10.0 100.0% 0 1.57s 243 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
OpenAI: GPT-5.4 4.0 7.2 44.4% 1 1.07s 50 0
Qwen: Qwen3.5-Flash 7.0 10.0 66.7% 0 905ms 15 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
OpenAI: GPT-5.4 5.5 10.0 50.0% 0 1.07s 81 0
Qwen: Qwen3.5-Flash 5.0 10.0 50.0% 0 8.81s 63 0
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
OpenAI: GPT-5.4 4.0 9.8 33.3% 0 1.52s 357 0
Qwen: Qwen3.5-Flash 1.3 10.0 0.0% 0 5.90s 608 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 2.75s 246 0
Qwen: Qwen3.5-Flash 10.0 10.0 100.0% 0 3.67s 264 0

झटपट तुलना

तुलना जोडी बदला