नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Google: Gemma 4 26B A4B vs OpenAI: GPT-5.3 Chat

सारांश

Gemma 4 26B A4B vs GPT-5.3 Chat benchmark तुलना: GPT-5.3 Chat average score में आगे है: 7.5 vs 7.2. Gemma 4 26B A4B की benchmark लागत कम है: $0.045 vs $0.433. GPT-5.3 Chat तेज है: 6.34s vs 63.41s, pass rates 69.8% vs 66.7%.

अनुशंसित मॉडल: GPT-5.3 Chat - It has the best score here (7.5), while responding about 10.0x faster than Gemma 4 26B A4B.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-07-02

मेट्रिक Gemma 4 26B A4B Gemma 4 26B A4B medium रिलीज़: 2026-04-03 निःशुल्क उपलब्ध GPT-5.3 Chat GPT-5.3 Chat none रिलीज़: 2026-03-03
स्कोर 7.2 7.5
रैंक #61 #47
विश्वसनीयता 10.0 10.0
संगति 9.2 8.1
सही परीक्षण
प्रति प्रयास पास दर 69.8% 66.7%
अस्थिर टेस्ट 2 5
कुल रन 63 63
प्रति परिणाम लागत 0.361 3.605
कुल लागत $0.045 $0.433
इनपुट कीमत $0.060 / 1M $1.750 / 1M
आउटपुट कीमत $0.330 / 1M $14.000 / 1M
कुल इनपुट टोकन 40,252 34,209
आउटपुट टोकन 28,000 26,617
रीजनिंग टोकन 100,490 0
प्रतिक्रिया समय (औसत) 63.41s 6.34s
प्रतिक्रिया समय (अधिकतम) 369.32s 18.33s
प्रतिक्रिया समय (कुल) 1268.28s 133.13s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#61 Gemma 4 26B A4B

medium
अमान्य SVG
लागत
$0.000
समय
300.0s
टोकन
0 tok

#47 GPT-5.3 Chat

none
लागत
$0.008
समय
8.1s
टोकन
634 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 26B A4B 10.0 10.0 100.0% 0 6.20s 816 1,142 3,045
GPT-5.3 Chat 6.7 8.1 58.3% 1 3.86s 606 3,167 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 26B A4B 2.9 10.0 0.0% 0 272.54s 5,062 14,838 44,567
GPT-5.3 Chat 5.6 4.7 55.6% 2 10.52s 7,302 6,632 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 26B A4B 9.6 10.0 100.0% 0 73.55s 17,092 5,415 13,112
GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 11,019 2,614 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 26B A4B 10.0 10.0 100.0% 0 16.51s 8,334 1,567 2,827
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.21s 7,140 942 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 26B A4B 2.9 4.4 22.2% 2 23.62s 516 2,469 7,105
GPT-5.3 Chat 3.5 4.4 33.3% 2 13.01s 723 8,264 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 26B A4B 10.0 10.0 100.0% 0 29.76s 567 25 5,075
GPT-5.3 Chat 4.6 10.0 0.0% 0 1.99s 477 319 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 26B A4B 10.0 10.0 100.0% 0 17.54s 777 887 4,470
GPT-5.3 Chat 9.8 10.0 100.0% 0 3.51s 660 1,491 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 26B A4B 10.0 10.0 100.0% 0 5.79s 801 410 2,128
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.99s 642 1,758 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 26B A4B 10.0 10.0 100.0% 0 9.01s 6,096 450 1,256
GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 5,445 861 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 26B A4B 3.0 10.0 0.0% 0 180.87s 191 797 16,905
GPT-5.3 Chat 3.0 10.0 0.0% 0 4.38s 195 569 0

त्वरित तुलना

तुलना जोड़ी बदलें