नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Google: Gemma 4 26B A4B vs OpenAI: GPT-5.4

सारांश

Gemma 4 26B A4B vs GPT-5.4 benchmark तुलना: GPT-5.4 average score में आगे है: 5.8 vs 5.5. Gemma 4 26B A4B की benchmark लागत कम है: $0.004 vs $0.122. GPT-5.4 तेज है: 1.42s vs 5.91s, pass rates 44.4% vs 36.5%.

अनुशंसित मॉडल: Gemma 4 26B A4B - Its score stays close to the best score here (5.5 vs 5.8), while costing about 40.5x less than GPT-5.4.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक Gemma 4 26B A4B Gemma 4 26B A4B none रिलीज़: 2026-04-03 निःशुल्क उपलब्ध GPT-5.4 GPT-5.4 none रिलीज़: 2026-03-05
स्कोर 5.5 5.8
रैंक #121 #112
विश्वसनीयता 10.0 10.0
संगति 9.2 9.2
सही परीक्षण
प्रति प्रयास पास दर 44.4% 36.5%
अस्थिर टेस्ट 2 2
कुल रन 63 63
प्रति परिणाम लागत 0.068 1.740
कुल लागत $0.004 $0.122
इनपुट कीमत $0.060 / 1M $2.500 / 1M
आउटपुट कीमत $0.330 / 1M $15.000 / 1M
कुल इनपुट टोकन 40,038 34,212
आउटपुट टोकन 1,824 2,417
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 5.91s 1.42s
प्रतिक्रिया समय (अधिकतम) 57.10s 2.95s
प्रतिक्रिया समय (कुल) 124.05s 29.87s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#121 Gemma 4 26B A4B

none
लागत
$0.001
समय
39.5s
टोकन
790 tok

#112 GPT-5.4

none
लागत
$0.026
समय
18.1s
टोकन
1,792 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 26B A4B 8.3 10.0 75.0% 0 1.28s 852 230 0
GPT-5.4 3.2 8.0 8.3% 1 1.21s 606 406 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 26B A4B 3.7 7.2 22.2% 1 4.16s 7,736 476 0
GPT-5.4 5.5 10.0 33.3% 0 1.62s 7,305 516 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 26B A4B 3.0 10.0 0.0% 0 30.53s 13,650 309 0
GPT-5.4 3.0 10.0 0.0% 0 2.89s 11,019 291 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 26B A4B 10.0 10.0 100.0% 0 1.70s 8,352 285 0
GPT-5.4 10.0 10.0 100.0% 0 1.04s 7,140 222 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 26B A4B 3.6 7.2 22.2% 1 2.49s 903 27 0
GPT-5.4 5.3 7.2 44.4% 1 1.07s 723 50 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 26B A4B 4.0 10.0 0.0% 0 3.54s 576 85 0
GPT-5.4 4.4 9.9 0.0% 0 1.78s 477 184 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 26B A4B 6.3 10.0 50.0% 0 690ms 795 75 0
GPT-5.4 6.5 10.0 50.0% 0 1.07s 660 81 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 26B A4B 6.2 10.0 33.3% 0 744ms 828 114 0
GPT-5.4 5.6 9.8 33.3% 0 1.44s 642 381 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 26B A4B 10.0 10.0 100.0% 0 57.10s 6,123 210 0
GPT-5.4 10.0 10.0 100.0% 0 2.75s 5,445 246 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 26B A4B 3.0 10.0 0.0% 0 778ms 223 13 0
GPT-5.4 3.0 10.0 0.0% 0 990ms 195 40 0

त्वरित तुलना

तुलना जोड़ी बदलें