नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Google: Gemini 2.5 Flash vs OpenAI: GPT-5.3-Codex

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-15

मेट्रिक Gemini 2.5 Flash Gemini 2.5 Flash medium रिलीज़: 2025-06-17 GPT-5.3-Codex GPT-5.3-Codex medium रिलीज़: 2026-02-05
रैंक #15 #5
स्कोर 8.0 8.7
संगति 9.5 9.1
प्रति परिणाम लागत 2.619 4.485
कुल लागत $0.288 $0.539
सही परीक्षण
प्रति प्रयास पास दर 72.9% 83.3%
अस्थिर टेस्ट 1 2
कुल रन 48 48
आउटपुट टोकन 1,370 1,764
रीजनिंग टोकन 110,522 33,348
प्रतिक्रिया समय (औसत) 12.35s 16.59s
प्रतिक्रिया समय (अधिकतम) 95.48s 100.93s
प्रतिक्रिया समय (कुल) 197.62s 265.39s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 7.8 10.0 66.7% 0 6.98s 249 8,832
GPT-5.3-Codex 10.0 10.0 100.0% 0 4.69s 216 1,421
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 10.0 10.0 100.0% 0 28.44s 303 11,922
GPT-5.3-Codex 10.0 10.0 100.0% 0 19.56s 364 2,731
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 10.0 10.0 100.0% 0 4.06s 279 2,325
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.07s 234 728
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 5.9 7.2 55.6% 1 37.34s 18 80,702
GPT-5.3-Codex 5.9 7.2 55.6% 1 64.31s 64 25,308
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 4.8 10.0 0.0% 0 4.86s 92 1,899
GPT-5.3-Codex 4.6 10.0 0.0% 0 4.87s 187 331
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 9.8 10.0 100.0% 0 2.62s 69 1,203
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.04s 93 693
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 7.7 10.0 66.7% 0 3.94s 126 2,499
GPT-5.3-Codex 9.0 7.9 88.9% 1 5.12s 352 1,644
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 10.0 10.0 100.0% 0 6.20s 234 1,140
GPT-5.3-Codex 10.0 10.0 100.0% 0 6.37s 254 492

त्वरित तुलना

तुलना जोड़ी बदलें