नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Google: Gemini 3.1 Flash Lite Preview vs OpenAI: GPT-5.4 Mini

सारांश

Gemini 3.1 Flash Lite Preview vs GPT-5.4 Mini benchmark तुलना: GPT-5.4 Mini average score में आगे है: 8.0 vs 6.5. Gemini 3.1 Flash Lite Preview की benchmark लागत कम है: $0.026 vs $0.526. Gemini 3.1 Flash Lite Preview तेज है: 2.77s vs 22.34s, pass rates 61.9% vs 73.0%.

अनुशंसित मॉडल: Gemini 3.1 Flash Lite Preview - It offers the best overall trade-off: a competitive score (6.5), lower cost than GPT-5.4 Mini, and balanced response time.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low रिलीज़: 2026-03-03 GPT-5.4 Mini GPT-5.4 Mini medium रिलीज़: 2026-03-17
स्कोर 6.5 8.0
रैंक #82 #27
विश्वसनीयता 10.0 10.0
संगति 10.0 8.0
सही परीक्षण
प्रति प्रयास पास दर 61.9% 73.0%
अस्थिर टेस्ट 0 5
कुल रन 63 63
प्रति परिणाम लागत 0.196 4.381
कुल लागत $0.026 $0.526
इनपुट कीमत $0.250 / 1M $0.750 / 1M
आउटपुट कीमत $1.500 / 1M $4.500 / 1M
कुल इनपुट टोकन 32,715 34,116
आउटपुट टोकन 2,286 2,181
रीजनिंग टोकन 9,166 108,937
प्रतिक्रिया समय (औसत) 2.77s 22.34s
प्रतिक्रिया समय (अधिकतम) 11.91s 138.75s
प्रतिक्रिया समय (कुल) 58.12s 469.20s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#82 Gemini 3.1 Flash Lite Preview

low
लागत
$0.002
समय
3.7s
टोकन
1,203 tok

#27 GPT-5.4 Mini

medium
लागत
$0.056
समय
95.5s
टोकन
12,464 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite Preview 8.3 10.0 75.0% 0 2.12s 506 462 1,638
GPT-5.4 Mini 8.6 7.9 91.7% 1 4.05s 606 296 2,876
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite Preview 5.5 10.0 33.3% 0 1.39s 8,138 660 1,060
GPT-5.4 Mini 8.4 7.4 88.9% 1 57.87s 7,305 467 40,902
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 11.91s 8,381 225 762
GPT-5.4 Mini 10.0 10.0 100.0% 0 17.81s 11,019 317 4,317
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.00s 7,455 291 696
GPT-5.4 Mini 10.0 10.0 100.0% 0 2.43s 7,140 234 650
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite Preview 5.3 10.0 33.3% 0 2.36s 641 18 1,212
GPT-5.4 Mini 4.1 4.4 44.5% 2 65.31s 619 60 43,286
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite Preview 4.0 10.0 0.0% 0 1.54s 490 69 384
GPT-5.4 Mini 4.5 10.0 0.0% 0 3.72s 477 150 510
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.49s 621 72 753
GPT-5.4 Mini 9.8 10.0 100.0% 0 2.13s 660 96 1,185
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.69s 566 243 1,248
GPT-5.4 Mini 7.8 10.0 66.7% 0 4.37s 642 278 2,443
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 9.54s 5,757 237 993
GPT-5.4 Mini 4.7 1.6 66.7% 1 9.62s 5,453 251 2,594
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 1.35s 160 9 420
GPT-5.4 Mini 3.0 10.0 0.0% 0 30.10s 195 32 10,174

त्वरित तुलना

तुलना जोड़ी बदलें