नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Qwen: Qwen3.7 Max vs xAI: Grok 4.3

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-22

मेट्रिक Qwen3.7 Max Qwen3.7 Max none प्रकाशन: 2026-05-22 Grok 4.3 Grok 4.3 medium प्रकाशन: 2026-05-01
स्कोअर 7.9 7.8
क्रमांक #27 #33
विश्वसनीयता 10.0 10.0
सुसंगतता 10.0 8.4
बरोबर चाचण्या
प्रति प्रयत्न पास दर 70.0% 75.0%
अस्थिर चाचण्या 0 4
एकूण रन 60 60
प्रति निकाल खर्च 0.719 4.562
एकूण खर्च $0.101 $0.593
???? ??? $2.500 / 1M $1.250 / 1M
????? ??? $7.500 / 1M $2.500 / 1M
आउटपुट टोकन्स 1,988 1,485
रिझनिंग टोकन्स 0 214,928
प्रतिसाद वेळ (सरासरी) 1.30s 49.23s
प्रतिसाद वेळ (कमाल) 3.92s 216.69s
प्रतिसाद वेळ (एकूण) 25.95s 984.54s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.7 Max 6.5 10.0 50.0% 0 1.08s 242 0
Grok 4.3 10.0 10.0 100.0% 0 8.83s 88 8,207
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.7 Max 6.8 10.0 50.0% 0 1.39s 576 0
Grok 4.3 7.4 6.5 66.7% 1 55.26s 532 24,554
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.7 Max 3.0 10.0 0.0% 0 2.17s 171 0
Grok 4.3 10.0 10.0 100.0% 0 63.99s 234 15,301
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.7 Max 10.0 10.0 100.0% 0 1.35s 243 0
Grok 4.3 10.0 10.0 100.0% 0 18.97s 180 9,546
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.7 Max 7.7 10.0 66.7% 0 975ms 15 0
Grok 4.3 5.3 7.2 44.4% 1 181.74s 14 111,300
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.7 Max 10.0 10.0 100.0% 0 1.04s 120 0
Grok 4.3 5.4 2.5 66.7% 1 24.70s 70 5,020
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.7 Max 10.0 10.0 100.0% 0 943ms 72 0
Grok 4.3 9.8 10.0 100.0% 0 18.58s 57 8,713
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.7 Max 10.0 10.0 100.0% 0 1.13s 314 0
Grok 4.3 5.9 7.2 55.6% 1 22.53s 128 14,686
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.7 Max 10.0 10.0 100.0% 0 3.92s 222 0
Grok 4.3 10.0 10.0 100.0% 0 17.66s 168 4,615
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.7 Max 3.0 10.0 0.0% 0 856ms 13 0
Grok 4.3 3.0 10.0 0.0% 0 44.47s 14 12,986

झटपट तुलना

तुलना जोडी बदला