नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Google: Gemini 3.5 Flash vs xAI: Grok 4.20

सारांश

Gemini 3.5 Flash vs Grok 4.20 benchmark तुलना: Gemini 3.5 Flash average score में आगे है: 9.8 vs 4.4. Grok 4.20 की benchmark लागत कम है: $0.057 vs $1.115. Grok 4.20 तेज है: 1.11s vs 8.84s, pass rates 96.8% vs 28.6%.

अनुशंसित मॉडल: Gemini 3.5 Flash - It has the strongest score in this comparison (9.8) and the best overall balance of cost and response time across all 2 models.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-07-02

मेट्रिक Gemini 3.5 Flash Gemini 3.5 Flash high रिलीज़: 2026-05-19 Grok 4.20 Grok 4.20 none रिलीज़: 2026-03-31
स्कोर 9.8 4.4
रैंक #1 #160
विश्वसनीयता 10.0 लागू नहीं
संगति 9.6 8.5
सही परीक्षण
प्रति प्रयास पास दर 96.8% 28.6%
अस्थिर टेस्ट 1 0
कुल रन 63 54
प्रति परिणाम लागत 5.575 1.570
कुल लागत $1.115 $0.057
इनपुट कीमत $1.500 / 1M $1.250 / 1M
आउटपुट कीमत $9.000 / 1M $2.500 / 1M
कुल इनपुट टोकन 37,594 41,313
आउटपुट टोकन 1,975 1,923
रीजनिंग टोकन 115,638 0
प्रतिक्रिया समय (औसत) 8.84s 1.11s
प्रतिक्रिया समय (अधिकतम) 34.82s 6.04s
प्रतिक्रिया समय (कुल) 185.57s 19.96s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#1 Gemini 3.5 Flash

high
लागत
$0.208
समय
118.2s
टोकन
23,158 tok

#160 xAI: Grok 4.20

none
लागत
$0.004
समय
6.5s
टोकन
1,367 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.57s 492 174 4,997
Grok 4.20 4.8 10.0 25.0% 0 501ms 1,986 267 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 22.96s 8,118 456 47,129
Grok 4.20 1.1 3.1 0.0% 0 1.22s 1,074 312 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 22.37s 12,873 351 16,323
Grok 4.20 3.0 10.0 0.0% 0 6.04s 17,673 282 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 6.43s 7,548 279 8,466
Grok 4.20 10.0 10.0 100.0% 0 522ms 7,749 207 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 7.6 7.2 77.8% 1 14.09s 633 12 24,721
Grok 4.20 3.0 10.0 0.0% 0 687ms 1,746 325 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.63s 486 115 1,650
Grok 4.20 4.8 10.0 0.0% 0 659ms 819 83 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.35s 615 70 3,799
Grok 4.20 6.3 10.0 50.0% 0 445ms 1,350 60 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.23s 558 241 4,940
Grok 4.20 5.3 10.0 33.3% 0 473ms 1,671 198 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 9.8 10.0 100.0% 0 4.96s 6,115 265 1,608
Grok 4.20 10.0 10.0 100.0% 0 4.63s 7,245 189 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.94s 156 12 2,005
Grok 4.20 0.0 0.0 0.0% 0 0ms 0 0 0

त्वरित तुलना

तुलना जोड़ी बदलें