नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Google: Gemini 3.5 Flash vs Grok 4.20 Beta

सारांश

Gemini 3.5 Flash vs Grok 4.20 Beta benchmark तुलना: Gemini 3.5 Flash average score में आगे है: 9.4 vs 5.8. Grok 4.20 Beta की benchmark लागत कम है: $0.087 vs $0.349. Grok 4.20 Beta तेज है: 1.19s vs 3.27s, pass rates 90.5% vs 37.0%.

अनुशंसित मॉडल: Gemini 3.5 Flash - It has the strongest score in this comparison (9.4) and the best overall balance of cost and response time across all 2 models.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-10

मेट्रिक Gemini 3.5 Flash Gemini 3.5 Flash low रिलीज़: 2026-05-19 Grok 4.20 Beta Grok 4.20 Beta none रिलीज़: 2026-03-12
स्कोर 9.4 5.8
रैंक #3 #107
विश्वसनीयता 10.0 लागू नहीं
संगति 10.0 9.6
सही परीक्षण
प्रति प्रयास पास दर 90.5% 37.0%
अस्थिर टेस्ट 0 1
कुल रन 63 52
प्रति परिणाम लागत 1.834 1.510
कुल लागत $0.349 $0.087
इनपुट कीमत $1.500 / 1M $2.041 / 1M
आउटपुट कीमत $9.000 / 1M $2.041 / 1M
कुल इनपुट टोकन 36,938 40,597
आउटपुट टोकन 2,033 1,657
रीजनिंग टोकन 30,519 0
प्रतिक्रिया समय (औसत) 3.27s 1.19s
प्रतिक्रिया समय (अधिकतम) 9.05s 6.48s
प्रतिक्रिया समय (कुल) 68.65s 21.43s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#3 Gemini 3.5 Flash

low
Cost
$0.068
Time
39.1s
Tokens
7,588 tok

#107 Grok 4.20 Beta

none
Invalid SVG
Cost
$0.004
Time
8.5s
Tokens
1,672 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.52s 494 209 2,536
Grok 4.20 Beta 4.0 8.4 16.7% 1 597ms 1,986 251 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 7.8 10.0 66.7% 0 6.71s 8,118 458 13,420
Grok 4.20 Beta 5.5 10.0 0.0% 0 1.14s 358 74 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 6.44s 12,873 351 3,050
Grok 4.20 Beta 3.0 10.0 0.0% 0 6.48s 17,673 282 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.81s 7,548 279 1,164
Grok 4.20 Beta 10.0 10.0 100.0% 0 601ms 7,749 197 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 7.7 10.0 66.7% 0 3.39s 633 12 4,538
Grok 4.20 Beta 3.0 10.0 0.0% 0 611ms 1,746 160 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.27s 486 119 916
Grok 4.20 Beta 5.0 10.0 0.0% 0 541ms 819 87 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 9.9 10.0 100.0% 0 1.86s 615 71 1,652
Grok 4.20 Beta 6.3 10.0 50.0% 0 649ms 1,350 60 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.35s 558 288 2,150
Grok 4.20 Beta 7.7 10.0 66.7% 0 586ms 1,671 357 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.27s 5,457 234 403
Grok 4.20 Beta 10.0 10.0 100.0% 0 4.79s 7,245 189 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.88s 156 12 690
Grok 4.20 Beta - - - - - - - - -

त्वरित तुलना

तुलना जोड़ी बदलें