नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Qwen: Qwen3.7 Max vs xAI: Grok 4.3

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-22

मेट्रिक Qwen3.7 Max Qwen3.7 Max none रिलीज़: 2026-05-22 Grok 4.3 Grok 4.3 medium रिलीज़: 2026-05-01
स्कोर 7.9 7.8
रैंक #27 #33
विश्वसनीयता 10.0 10.0
संगति 10.0 8.4
सही परीक्षण
प्रति प्रयास पास दर 70.0% 75.0%
अस्थिर टेस्ट 0 4
कुल रन 60 60
प्रति परिणाम लागत 0.719 4.562
कुल लागत $0.101 $0.593
???? ??? $2.500 / 1M $1.250 / 1M
????? ??? $7.500 / 1M $2.500 / 1M
आउटपुट टोकन 1,988 1,485
रीजनिंग टोकन 0 214,928
प्रतिक्रिया समय (औसत) 1.30s 49.23s
प्रतिक्रिया समय (अधिकतम) 3.92s 216.69s
प्रतिक्रिया समय (कुल) 25.95s 984.54s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.7 Max 6.5 10.0 50.0% 0 1.08s 242 0
Grok 4.3 10.0 10.0 100.0% 0 8.83s 88 8,207
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.7 Max 6.8 10.0 50.0% 0 1.39s 576 0
Grok 4.3 7.4 6.5 66.7% 1 55.26s 532 24,554
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.7 Max 3.0 10.0 0.0% 0 2.17s 171 0
Grok 4.3 10.0 10.0 100.0% 0 63.99s 234 15,301
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.7 Max 10.0 10.0 100.0% 0 1.35s 243 0
Grok 4.3 10.0 10.0 100.0% 0 18.97s 180 9,546
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.7 Max 7.7 10.0 66.7% 0 975ms 15 0
Grok 4.3 5.3 7.2 44.4% 1 181.74s 14 111,300
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.7 Max 10.0 10.0 100.0% 0 1.04s 120 0
Grok 4.3 5.4 2.5 66.7% 1 24.70s 70 5,020
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.7 Max 10.0 10.0 100.0% 0 943ms 72 0
Grok 4.3 9.8 10.0 100.0% 0 18.58s 57 8,713
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.7 Max 10.0 10.0 100.0% 0 1.13s 314 0
Grok 4.3 5.9 7.2 55.6% 1 22.53s 128 14,686
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.7 Max 10.0 10.0 100.0% 0 3.92s 222 0
Grok 4.3 10.0 10.0 100.0% 0 17.66s 168 4,615
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.7 Max 3.0 10.0 0.0% 0 856ms 13 0
Grok 4.3 3.0 10.0 0.0% 0 44.47s 14 12,986

त्वरित तुलना

तुलना जोड़ी बदलें