नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Google: Gemini 3.1 Flash Lite Preview vs OpenAI: GPT-5.5

सारांश

Gemini 3.1 Flash Lite Preview vs GPT-5.5 benchmark तुलना: GPT-5.5 average score में आगे है: 9.3 vs 6.1. GPT-5.5 की benchmark लागत कम है: $0.907 vs $2.310. GPT-5.5 तेज है: 9.76s vs 68.14s, pass rates 61.9% vs 85.7%.

अनुशंसित मॉडल: GPT-5.5 - It has the best score here (9.3), while costing about 2.5x less than Gemini 3.1 Flash Lite Preview.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview high रिलीज़: 2026-03-03 GPT-5.5 GPT-5.5 low रिलीज़: 2026-04-24
स्कोर 6.1 9.3
रैंक #95 #4
विश्वसनीयता लागू नहीं 10.0
संगति 7.6 10.0
सही परीक्षण
प्रति प्रयास पास दर 61.9% 85.7%
अस्थिर टेस्ट 0 0
कुल रन 48 63
प्रति परिणाम लागत 17.763 5.035
कुल लागत $2.310 $0.907
इनपुट कीमत $0.250 / 1M $5.000 / 1M
आउटपुट कीमत $1.500 / 1M $30.000 / 1M
कुल इनपुट टोकन 28,980 34,209
आउटपुट टोकन 1,283 2,046
रीजनिंग टोकन 1,533,310 22,460
प्रतिक्रिया समय (औसत) 68.14s 9.76s
प्रतिक्रिया समय (अधिकतम) 280.52s 56.19s
प्रतिक्रिया समय (कुल) 1090.28s 204.92s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#95 Gemini 3.1 Flash Lite Preview

high
लागत
$0.096
समय
133.9s
टोकन
63,687 tok

#4 GPT-5.5

low
लागत
$0.068
समय
37.0s
टोकन
2,339 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite Preview 7.5 7.5 75.0% 0 43.87s 368 144 193,077
GPT-5.5 10.0 10.0 100.0% 0 4.41s 606 238 1,020
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite Preview 0.0 0.0 0.0% 0 0ms 0 0 0
GPT-5.5 10.0 10.0 100.0% 0 15.04s 7,302 423 6,402
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 280.52s 13,175 335 380,440
GPT-5.5 10.0 10.0 100.0% 0 9.56s 11,019 303 717
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 7.16s 7,360 279 6,186
GPT-5.5 10.0 10.0 100.0% 0 3.28s 7,140 228 157
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite Preview 5.3 10.0 33.3% 0 127.58s 643 18 566,202
GPT-5.5 5.3 10.0 33.3% 0 28.05s 723 69 11,609
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 5.25s 490 117 3,915
GPT-5.5 10.0 10.0 100.0% 0 5.17s 477 133 245
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite Preview 9.8 10.0 100.0% 0 64.03s 625 69 190,053
GPT-5.5 9.9 10.0 100.0% 0 3.74s 660 93 415
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite Preview 7.7 10.0 66.7% 0 46.68s 564 87 190,953
GPT-5.5 10.0 10.0 100.0% 0 4.74s 642 279 954
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 7.73s 5,755 234 2,484
GPT-5.5 10.0 10.0 100.0% 0 4.96s 5,445 250 101
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite Preview 0.0 0.0 0.0% 0 0ms 0 0 0
GPT-5.5 3.0 10.0 0.0% 0 10.06s 195 30 840

त्वरित तुलना

तुलना जोड़ी बदलें