नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Google: Gemini 3.5 Flash vs xAI: Grok 4.3

सारांश

Gemini 3.5 Flash vs Grok 4.3 benchmark तुलना: Gemini 3.5 Flash average score में आगे है: 9.8 vs 7.7. Grok 4.3 की benchmark लागत कम है: $0.614 vs $1.115. Gemini 3.5 Flash तेज है: 8.84s vs 47.51s, pass rates 96.8% vs 71.4%.

अनुशंसित मॉडल: Gemini 3.5 Flash - It has the best score here (9.8), while responding about 5.4x faster than Grok 4.3.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-12

मेट्रिक Gemini 3.5 Flash Gemini 3.5 Flash high रिलीज़: 2026-05-19 Grok 4.3 Grok 4.3 medium रिलीज़: 2026-05-01
स्कोर 9.8 7.7
रैंक #1 #40
विश्वसनीयता 10.0 10.0
संगति 9.6 8.5
सही परीक्षण
प्रति प्रयास पास दर 96.8% 71.4%
अस्थिर टेस्ट 1 4
कुल रन 63 63
प्रति परिणाम लागत 5.575 4.724
कुल लागत $1.115 $0.614
इनपुट कीमत $1.500 / 1M $1.250 / 1M
आउटपुट कीमत $9.000 / 1M $2.500 / 1M
कुल इनपुट टोकन 37,594 44,472
आउटपुट टोकन 1,975 1,981
रीजनिंग टोकन 115,638 221,382
प्रतिक्रिया समय (औसत) 8.84s 47.51s
प्रतिक्रिया समय (अधिकतम) 34.82s 216.69s
प्रतिक्रिया समय (कुल) 185.57s 997.68s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#1 Gemini 3.5 Flash

high
Cost
$0.208
Time
118.2s
Tokens
23,158 tok

#40 xAI: Grok 4.3

medium
Cost
$0.009
Time
19.0s
Tokens
3,661 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.57s 492 174 4,997
Grok 4.3 10.0 10.0 100.0% 0 8.83s 2,010 88 8,207
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 22.96s 8,118 456 47,129
Grok 4.3 5.9 7.7 44.4% 1 41.23s 8,340 1,028 31,226
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 22.37s 12,873 351 16,323
Grok 4.3 10.0 10.0 100.0% 0 63.99s 12,909 234 15,301
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 6.43s 7,548 279 8,466
Grok 4.3 10.0 10.0 100.0% 0 18.97s 7,761 180 9,546
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 7.6 7.2 77.8% 1 14.09s 633 12 24,721
Grok 4.3 5.3 7.2 44.4% 1 181.74s 1,764 14 111,300
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.63s 486 115 1,650
Grok 4.3 5.4 2.5 66.7% 1 24.70s 825 70 5,020
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.35s 615 70 3,799
Grok 4.3 9.8 10.0 100.0% 0 18.58s 1,362 57 8,713
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.23s 558 241 4,940
Grok 4.3 5.9 7.2 55.6% 1 22.52s 1,689 128 14,468
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 9.8 10.0 100.0% 0 4.96s 6,115 265 1,608
Grok 4.3 10.0 10.0 100.0% 0 17.66s 7,263 168 4,615
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.94s 156 12 2,005
Grok 4.3 3.0 10.0 0.0% 0 44.47s 549 14 12,986

त्वरित तुलना

तुलना जोड़ी बदलें