नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Google: Gemini 3.5 Flash vs OpenAI: GPT-5.3-Codex

सारांश

Gemini 3.5 Flash vs GPT-5.3-Codex benchmark तुलना: GPT-5.3-Codex average score में आगे है: 8.4 vs 8.1. GPT-5.3-Codex की benchmark लागत कम है: $0.740 vs $1.079. Gemini 3.5 Flash तेज है: 9.93s vs 16.22s, pass rates 77.8% vs 82.5%.

अनुशंसित मॉडल: GPT-5.3-Codex - It has the strongest score in this comparison (8.4) and the best overall balance of cost and response time across all 2 models.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-04

मेट्रिक Gemini 3.5 Flash Gemini 3.5 Flash none रिलीज़: 2026-05-19 GPT-5.3-Codex GPT-5.3-Codex medium रिलीज़: 2026-02-05
स्कोर 8.1 8.4
रैंक #20 #15
विश्वसनीयता 10.0 10.0
संगति 8.9 8.5
सही परीक्षण
प्रति प्रयास पास दर 77.8% 82.5%
अस्थिर टेस्ट 3 4
कुल रन 63 63
प्रति परिणाम लागत 7.190 4.932
कुल लागत $1.079 $0.740
इनपुट कीमत $1.500 / 1M $1.750 / 1M
आउटपुट कीमत $9.000 / 1M $14.000 / 1M
कुल इनपुट टोकन 13,843 34,299
आउटपुट टोकन 117,518 2,357
रीजनिंग टोकन 0 46,189
प्रतिक्रिया समय (औसत) 9.93s 16.22s
प्रतिक्रिया समय (अधिकतम) 64.36s 100.93s
प्रतिक्रिया समय (कुल) 178.68s 340.67s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#20 Gemini 3.5 Flash

none
Cost
$0.225
Time
125.5s
Tokens
25,004 tok

#15 GPT-5.3-Codex

medium
Cost
$0.049
Time
54.9s
Tokens
3,580 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.53s 492 5,101 0
GPT-5.3-Codex 8.7 7.9 91.7% 1 4.16s 606 240 1,722
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 8.8 7.8 88.9% 1 34.69s 8,122 75,927 0
GPT-5.3-Codex 10.0 10.0 100.0% 0 19.50s 7,302 535 10,890
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 3.0 10.0 0.0% 0 0ms 0 0 0
GPT-5.3-Codex 10.0 10.0 100.0% 0 19.56s 11,019 364 2,731
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 6.5 10.0 50.0% 0 8.10s 2,781 5,895 0
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.07s 7,140 234 728
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 7.6 7.2 77.8% 1 10.64s 633 17,910 0
GPT-5.3-Codex 5.9 7.2 55.6% 1 64.31s 813 64 25,308
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.46s 486 1,620 0
GPT-5.3-Codex 4.6 10.0 0.0% 0 4.87s 477 187 331
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 9.8 10.0 100.0% 0 3.38s 615 3,928 0
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.04s 660 93 693
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.13s 558 4,640 0
GPT-5.3-Codex 9.0 7.9 88.9% 1 5.05s 642 356 1,593
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 3.0 10.0 0.0% 0 0ms 0 0 0
GPT-5.3-Codex 10.0 10.0 100.0% 0 6.37s 5,445 254 492
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 2.8 1.6 33.3% 1 4.87s 156 2,497 0
GPT-5.3-Codex 2.8 1.6 33.3% 1 14.43s 195 30 1,701

त्वरित तुलना

तुलना जोड़ी बदलें