नेविगेशन
AI BENCHY
तुलना करें चार्ट Karyapranali
❤️ Made by XCS
Your ad here

AI BENCHY तुलना

Google: Gemini 3 Flash Preview vs OpenAI: GPT-5.4

तुलना करें:

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-06

मेट्रिक Google: Gemini 3 Flash Preview none रिलीज़: 2025-12-17 OpenAI: GPT-5.4 medium रिलीज़: 2026-03-05
रैंक #20 #9
औसत स्कोर 7.2 8.0
संगति 9.0 8.5
प्रति परिणाम लागत 0.169 6.601
कुल लागत $0.019 $0.793
सही परीक्षण
प्रति प्रयास पास दर 75.0% 83.3%
अस्थिर टेस्ट 2 3
कुल रन 48 (16 x 3) 48 (16 x 3)
आउटपुट टोकन 1,411 1,756
रीजनिंग टोकन 0 46,642
प्रतिक्रिया समय (औसत) 1.75s 20.05s
प्रतिक्रिया समय (अधिकतम) 3.56s 100.41s
प्रतिक्रिया समय (कुल) 15.71s 320.87s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

औसत स्कोर vs प्रतिक्रिया समय (औसत)

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Google: Gemini 3 Flash Preview 7.0 10.0 66.7% 0 1.59s 208 0
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 5.02s 216 1,466
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Google: Gemini 3 Flash Preview 10.0 1.6 66.7% 1 3.56s 350 0
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 20.57s 301 3,543
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Google: Gemini 3 Flash Preview 9.9 10.0 100.0% 0 1.41s 279 0
OpenAI: GPT-5.4 9.9 10.0 100.0% 0 5.32s 234 804
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Google: Gemini 3 Flash Preview 7.0 10.0 66.7% 0 963ms 18 0
OpenAI: GPT-5.4 4.0 7.2 44.4% 1 74.27s 61 34,748
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Google: Gemini 3 Flash Preview 10.0 10.0 100.0% 0 1.13s 104 0
OpenAI: GPT-5.4 5.0 3.1 33.3% 1 4.92s 145 321
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Google: Gemini 3 Flash Preview 5.5 5.8 66.7% 1 1.58s 74 0
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 3.11s 93 897
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Google: Gemini 3 Flash Preview 7.0 10.0 66.7% 0 1.06s 144 0
OpenAI: GPT-5.4 7.0 7.2 88.9% 1 9.13s 442 3,832
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Google: Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.35s 234 0
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 13.28s 264 1,031

त्वरित तुलना

तुलना जोड़ी बदलें