नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Google: Gemini 2.5 Flash vs OpenAI: GPT-5.4

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-15

मेट्रिक Gemini 2.5 Flash Gemini 2.5 Flash medium रिलीज़: 2025-06-17 GPT-5.4 GPT-5.4 medium रिलीज़: 2026-03-05
रैंक #15 #9
स्कोर 8.0 8.5
संगति 9.5 8.5
प्रति परिणाम लागत 2.619 6.601
कुल लागत $0.288 $0.793
सही परीक्षण
प्रति प्रयास पास दर 72.9% 83.3%
अस्थिर टेस्ट 1 3
कुल रन 48 48
आउटपुट टोकन 1,370 1,756
रीजनिंग टोकन 110,522 46,642
प्रतिक्रिया समय (औसत) 12.35s 20.05s
प्रतिक्रिया समय (अधिकतम) 95.48s 100.41s
प्रतिक्रिया समय (कुल) 197.62s 320.87s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 7.8 10.0 66.7% 0 6.98s 249 8,832
GPT-5.4 10.0 10.0 100.0% 0 5.02s 216 1,466
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 10.0 10.0 100.0% 0 28.44s 303 11,922
GPT-5.4 10.0 10.0 100.0% 0 20.57s 301 3,543
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 10.0 10.0 100.0% 0 4.06s 279 2,325
GPT-5.4 10.0 10.0 100.0% 0 5.32s 234 804
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 5.9 7.2 55.6% 1 37.34s 18 80,702
GPT-5.4 5.3 7.2 44.4% 1 74.27s 61 34,748
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 4.8 10.0 0.0% 0 4.86s 92 1,899
GPT-5.4 4.7 3.1 33.3% 1 4.92s 145 321
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 9.8 10.0 100.0% 0 2.62s 69 1,203
GPT-5.4 10.0 10.0 100.0% 0 3.11s 93 897
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 7.7 10.0 66.7% 0 3.94s 126 2,499
GPT-5.4 8.2 7.2 88.9% 1 9.13s 442 3,832
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 10.0 10.0 100.0% 0 6.20s 234 1,140
GPT-5.4 10.0 10.0 100.0% 0 13.28s 264 1,031

त्वरित तुलना

तुलना जोड़ी बदलें