नेविगेशन
AI BENCHY
तुलना करें चार्ट Karyapranali
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Google: Gemini 2.5 Flash vs OpenAI: GPT-5.4

तुलना करें:

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-06

मेट्रिक Google: Gemini 2.5 Flash none रिलीज़: 2025-06-17 OpenAI: GPT-5.4 medium रिलीज़: 2026-03-05
रैंक #38 #9
औसत स्कोर 5.2 8.0
संगति 9.1 8.5
प्रति परिणाम लागत 0.191 6.601
कुल लागत $0.012 $0.793
सही परीक्षण
प्रति प्रयास पास दर 43.8% 83.3%
अस्थिर टेस्ट 2 3
कुल रन 48 (16 x 3) 48 (16 x 3)
आउटपुट टोकन 1,270 1,756
रीजनिंग टोकन 0 46,642
प्रतिक्रिया समय (औसत) 923ms 20.05s
प्रतिक्रिया समय (अधिकतम) 4.39s 100.41s
प्रतिक्रिया समय (कुल) 14.78s 320.87s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

औसत स्कोर vs प्रतिक्रिया समय (औसत)

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Google: Gemini 2.5 Flash 10.0 10.0 0.0% 0 668ms 99 0
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 5.02s 216 1,466
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Google: Gemini 2.5 Flash 10.0 10.0 0.0% 0 4.39s 366 0
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 20.57s 301 3,543
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Google: Gemini 2.5 Flash 9.9 10.0 100.0% 0 652ms 279 0
OpenAI: GPT-5.4 9.9 10.0 100.0% 0 5.32s 234 804
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Google: Gemini 2.5 Flash 4.0 7.2 55.6% 1 495ms 12 0
OpenAI: GPT-5.4 4.0 7.2 44.4% 1 74.27s 61 34,748
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Google: Gemini 2.5 Flash 5.0 10.0 0.0% 0 615ms 78 0
OpenAI: GPT-5.4 5.0 3.1 33.3% 1 4.92s 145 321
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Google: Gemini 2.5 Flash 9.0 6.8 66.7% 1 672ms 70 0
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 3.11s 93 897
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Google: Gemini 2.5 Flash 4.7 10.0 33.3% 0 576ms 132 0
OpenAI: GPT-5.4 7.0 7.2 88.9% 1 9.13s 442 3,832
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Google: Gemini 2.5 Flash 10.0 10.0 100.0% 0 1.91s 234 0
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 13.28s 264 1,031

त्वरित तुलना

तुलना जोड़ी बदलें