नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Google: Gemini 3.5 Flash vs OpenAI: GPT-5.4 Mini

सारांश

Gemini 3.5 Flash vs GPT-5.4 Mini benchmark तुलना: Gemini 3.5 Flash average score में आगे है: 9.8 vs 8.0. GPT-5.4 Mini की benchmark लागत कम है: $0.526 vs $1.115. Gemini 3.5 Flash तेज है: 8.84s vs 22.34s, pass rates 96.8% vs 73.0%.

अनुशंसित मॉडल: Gemini 3.5 Flash - It has the best score here (9.8), while responding about 2.5x faster than GPT-5.4 Mini.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-12

मेट्रिक Gemini 3.5 Flash Gemini 3.5 Flash high रिलीज़: 2026-05-19 GPT-5.4 Mini GPT-5.4 Mini medium रिलीज़: 2026-03-17
स्कोर 9.8 8.0
रैंक #1 #30
विश्वसनीयता 10.0 10.0
संगति 9.6 8.0
सही परीक्षण
प्रति प्रयास पास दर 96.8% 73.0%
अस्थिर टेस्ट 1 5
कुल रन 63 63
प्रति परिणाम लागत 5.575 4.381
कुल लागत $1.115 $0.526
इनपुट कीमत $1.500 / 1M $0.750 / 1M
आउटपुट कीमत $9.000 / 1M $4.500 / 1M
कुल इनपुट टोकन 37,594 34,116
आउटपुट टोकन 1,975 2,181
रीजनिंग टोकन 115,638 108,937
प्रतिक्रिया समय (औसत) 8.84s 22.34s
प्रतिक्रिया समय (अधिकतम) 34.82s 138.75s
प्रतिक्रिया समय (कुल) 185.57s 469.20s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#1 Gemini 3.5 Flash

high
Cost
$0.208
Time
118.2s
Tokens
23,158 tok

#30 GPT-5.4 Mini

medium
Cost
$0.056
Time
95.5s
Tokens
12,464 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.57s 492 174 4,997
GPT-5.4 Mini 8.6 7.9 91.7% 1 4.05s 606 296 2,876
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 22.96s 8,118 456 47,129
GPT-5.4 Mini 8.4 7.4 88.9% 1 57.87s 7,305 467 40,902
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 22.37s 12,873 351 16,323
GPT-5.4 Mini 10.0 10.0 100.0% 0 17.81s 11,019 317 4,317
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 6.43s 7,548 279 8,466
GPT-5.4 Mini 10.0 10.0 100.0% 0 2.43s 7,140 234 650
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 7.6 7.2 77.8% 1 14.09s 633 12 24,721
GPT-5.4 Mini 4.1 4.4 44.5% 2 65.31s 619 60 43,286
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.63s 486 115 1,650
GPT-5.4 Mini 4.5 10.0 0.0% 0 3.72s 477 150 510
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.35s 615 70 3,799
GPT-5.4 Mini 9.8 10.0 100.0% 0 2.13s 660 96 1,185
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.23s 558 241 4,940
GPT-5.4 Mini 7.8 10.0 66.7% 0 4.37s 642 278 2,443
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 9.8 10.0 100.0% 0 4.96s 6,115 265 1,608
GPT-5.4 Mini 4.7 1.6 66.7% 1 9.62s 5,453 251 2,594
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.94s 156 12 2,005
GPT-5.4 Mini 3.0 10.0 0.0% 0 30.10s 195 32 10,174

त्वरित तुलना

तुलना जोड़ी बदलें