नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Google: Gemini 3.5 Flash vs Grok 4.20 Beta

सारांश

Gemini 3.5 Flash vs Grok 4.20 Beta benchmark तुलना: Gemini 3.5 Flash average score में आगे है: 9.6 vs 8.5. Grok 4.20 Beta की benchmark लागत कम है: $0.750 vs $1.115. Gemini 3.5 Flash तेज है: 8.84s vs 9.75s, pass rates 96.8% vs 81.5%.

अनुशंसित मॉडल: Gemini 3.5 Flash - It has the strongest score in this comparison (9.6) and the best overall balance of cost and response time across all 2 models.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-10

मेट्रिक Gemini 3.5 Flash Gemini 3.5 Flash high रिलीज़: 2026-05-19 Grok 4.20 Beta Grok 4.20 Beta medium रिलीज़: 2026-03-12
स्कोर 9.6 8.5
रैंक #2 #14
विश्वसनीयता 10.0 लागू नहीं
संगति 9.6 9.5
सही परीक्षण
प्रति प्रयास पास दर 96.8% 81.5%
अस्थिर टेस्ट 1 1
कुल रन 63 52
प्रति परिणाम लागत 5.575 4.505
कुल लागत $1.115 $0.750
इनपुट कीमत $1.500 / 1M $5.805 / 1M
आउटपुट कीमत $9.000 / 1M $5.805 / 1M
कुल इनपुट टोकन 37,594 35,955
आउटपुट टोकन 1,975 1,647
रीजनिंग टोकन 115,638 91,565
प्रतिक्रिया समय (औसत) 8.84s 9.75s
प्रतिक्रिया समय (अधिकतम) 34.82s 31.36s
प्रतिक्रिया समय (कुल) 185.57s 175.48s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#2 Gemini 3.5 Flash

high
Cost
$0.208
Time
118.2s
Tokens
23,158 tok

#14 Grok 4.20 Beta

medium
Cost
$0.034
Time
91.0s
Tokens
13,523 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.57s 492 174 4,997
Grok 4.20 Beta 8.7 7.9 91.7% 1 3.16s 2,010 268 7,583
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 22.96s 8,118 456 47,129
Grok 4.20 Beta 10.0 10.0 100.0% 0 31.36s 360 81 3,987
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 22.37s 12,873 351 16,323
Grok 4.20 Beta 10.0 10.0 100.0% 0 20.93s 12,909 227 12,212
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 6.43s 7,548 279 8,466
Grok 4.20 Beta 10.0 10.0 100.0% 0 4.01s 7,761 180 5,281
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 7.6 7.2 77.8% 1 14.09s 633 12 24,721
Grok 4.20 Beta 5.3 10.0 33.3% 0 21.33s 1,764 251 40,255
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.63s 486 115 1,650
Grok 4.20 Beta 10.0 10.0 100.0% 0 5.78s 825 72 3,440
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.35s 615 70 3,799
Grok 4.20 Beta 9.8 10.0 100.0% 0 4.89s 1,362 57 7,123
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.23s 558 241 4,940
Grok 4.20 Beta 10.0 10.0 100.0% 0 3.52s 1,689 328 6,300
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 9.8 10.0 100.0% 0 4.96s 6,115 265 1,608
Grok 4.20 Beta 3.0 10.0 0.0% 0 12.39s 7,275 183 5,384
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.94s 156 12 2,005
Grok 4.20 Beta - - - - - - - - -

त्वरित तुलना

तुलना जोड़ी बदलें