नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Qwen: Qwen3.7 Plus vs xAI: Grok Build 0.1

सारांश

Qwen3.7 Plus vs Grok Build 0.1 benchmark तुलना: Grok Build 0.1 average score में आगे है: 7.6 vs 7.2. Qwen3.7 Plus की benchmark लागत कम है: $0.023 vs $0.927. Qwen3.7 Plus तेज है: 2.85s vs 49.90s, pass rates 47.6% vs 61.9%.

अनुशंसित मॉडल: Qwen3.7 Plus - Its score stays close to the best score here (7.2 vs 7.6), while costing about 42.0x less than Grok Build 0.1.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-07-02

मेट्रिक Qwen3.7 Plus Qwen3.7 Plus none रिलीज़: 2026-06-03 Grok Build 0.1 Grok Build 0.1 medium रिलीज़: 2026-05-21
स्कोर 7.2 7.6
रैंक #62 #44
विश्वसनीयता 10.0 10.0
संगति 10.0 9.9
सही परीक्षण
प्रति प्रयास पास दर 47.6% 61.9%
अस्थिर टेस्ट 0 0
कुल रन 63 63
प्रति परिणाम लागत 0.276 7.124
कुल लागत $0.023 $0.927
इनपुट कीमत $0.320 / 1M $1.000 / 1M
आउटपुट कीमत $1.280 / 1M $2.000 / 1M
कुल इनपुट टोकन 42,510 44,418
आउटपुट टोकन 6,578 2,782
रीजनिंग टोकन 0 438,018
प्रतिक्रिया समय (औसत) 2.85s 49.90s
प्रतिक्रिया समय (अधिकतम) 29.38s 252.69s
प्रतिक्रिया समय (कुल) 59.86s 1047.92s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#62 Qwen3.7 Plus

none
लागत
$0.019
समय
213.5s
टोकन
11,960 tok

#44 xAI: Grok Build 0.1

medium
लागत
$0.028
समय
81.3s
टोकन
14,009 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.7 Plus 6.5 10.0 50.0% 0 1.38s 696 349 0
Grok Build 0.1 8.3 10.0 75.0% 0 7.43s 2,010 220 12,162
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.7 Plus 5.5 10.0 33.3% 0 2.15s 7,911 639 0
Grok Build 0.1 5.7 9.7 33.3% 0 108.46s 8,304 1,138 161,452
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.7 Plus 10.0 10.0 100.0% 0 29.38s 14,952 4,505 0
Grok Build 0.1 10.0 10.0 100.0% 0 32.81s 12,909 231 16,917
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.7 Plus 10.0 10.0 100.0% 0 1.43s 7,794 243 0
Grok Build 0.1 10.0 10.0 100.0% 0 10.72s 7,761 180 8,876
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.7 Plus 3.0 10.0 0.0% 0 868ms 789 18 0
Grok Build 0.1 5.3 10.0 33.3% 0 158.00s 1,764 492 175,294
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.7 Plus 5.3 10.0 0.0% 0 1.33s 522 78 0
Grok Build 0.1 4.4 9.9 0.0% 0 18.41s 825 76 6,345
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.7 Plus 6.3 10.0 50.0% 0 929ms 711 72 0
Grok Build 0.1 9.8 10.0 100.0% 0 12.36s 1,362 57 9,599
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.7 Plus 7.7 10.0 66.7% 0 1.71s 714 443 0
Grok Build 0.1 7.7 10.0 66.7% 0 18.26s 1,689 195 20,841
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.7 Plus 10.0 10.0 100.0% 0 3.54s 8,211 222 0
Grok Build 0.1 10.0 10.0 100.0% 0 13.12s 7,263 180 4,969
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.7 Plus 3.0 10.0 0.0% 0 1.21s 210 9 0
Grok Build 0.1 3.0 10.0 0.0% 0 53.51s 531 13 21,563

त्वरित तुलना

तुलना जोड़ी बदलें