नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Google: Gemini 3.1 Flash Lite Preview vs OpenAI: GPT-5.3-Codex

सारांश

Gemini 3.1 Flash Lite Preview vs GPT-5.3-Codex benchmark तुलना: GPT-5.3-Codex average score में आगे है: 8.9 vs 6.5. Gemini 3.1 Flash Lite Preview की benchmark लागत कम है: $0.026 vs $0.740. Gemini 3.1 Flash Lite Preview तेज है: 2.77s vs 16.22s, pass rates 61.9% vs 82.5%.

अनुशंसित मॉडल: Gemini 3.1 Flash Lite Preview - It offers the best overall trade-off: a competitive score (6.5), lower cost than GPT-5.3-Codex, and balanced response time.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low रिलीज़: 2026-03-03 GPT-5.3-Codex GPT-5.3-Codex medium रिलीज़: 2026-02-05
स्कोर 6.5 8.9
रैंक #82 #10
विश्वसनीयता 10.0 10.0
संगति 10.0 8.5
सही परीक्षण
प्रति प्रयास पास दर 61.9% 82.5%
अस्थिर टेस्ट 0 4
कुल रन 63 63
प्रति परिणाम लागत 0.196 4.932
कुल लागत $0.026 $0.740
इनपुट कीमत $0.250 / 1M $1.750 / 1M
आउटपुट कीमत $1.500 / 1M $14.000 / 1M
कुल इनपुट टोकन 32,715 34,299
आउटपुट टोकन 2,286 2,357
रीजनिंग टोकन 9,166 46,189
प्रतिक्रिया समय (औसत) 2.77s 16.22s
प्रतिक्रिया समय (अधिकतम) 11.91s 100.93s
प्रतिक्रिया समय (कुल) 58.12s 340.67s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#82 Gemini 3.1 Flash Lite Preview

low
लागत
$0.002
समय
3.7s
टोकन
1,203 tok

#10 GPT-5.3-Codex

medium
लागत
$0.049
समय
54.9s
टोकन
3,580 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite Preview 8.3 10.0 75.0% 0 2.12s 506 462 1,638
GPT-5.3-Codex 8.7 7.9 91.7% 1 4.16s 606 240 1,722
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite Preview 5.5 10.0 33.3% 0 1.39s 8,138 660 1,060
GPT-5.3-Codex 10.0 10.0 100.0% 0 19.50s 7,302 535 10,890
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 11.91s 8,381 225 762
GPT-5.3-Codex 10.0 10.0 100.0% 0 19.56s 11,019 364 2,731
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.00s 7,455 291 696
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.07s 7,140 234 728
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite Preview 5.3 10.0 33.3% 0 2.36s 641 18 1,212
GPT-5.3-Codex 5.9 7.2 55.6% 1 64.31s 813 64 25,308
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite Preview 4.0 10.0 0.0% 0 1.54s 490 69 384
GPT-5.3-Codex 4.6 10.0 0.0% 0 4.87s 477 187 331
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.49s 621 72 753
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.04s 660 93 693
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.69s 566 243 1,248
GPT-5.3-Codex 9.0 7.9 88.9% 1 5.05s 642 356 1,593
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 9.54s 5,757 237 993
GPT-5.3-Codex 10.0 10.0 100.0% 0 6.37s 5,445 254 492
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 1.35s 160 9 420
GPT-5.3-Codex 2.8 1.6 33.3% 1 14.43s 195 30 1,701

त्वरित तुलना

तुलना जोड़ी बदलें