नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Google: Gemini 3.1 Flash Lite vs OpenAI: GPT-5.5

सारांश

Gemini 3.1 Flash Lite vs GPT-5.5 benchmark तुलना: GPT-5.5 average score में आगे है: 6.3 vs 6.1. Gemini 3.1 Flash Lite की benchmark लागत कम है: $0.013 vs $0.231. Gemini 3.1 Flash Lite तेज है: 1.33s vs 1.89s, pass rates 54.0% vs 54.0%.

अनुशंसित मॉडल: Gemini 3.1 Flash Lite - Its score stays close to the best score here (6.1 vs 6.3), while costing about 17.7x less than GPT-5.5.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite minimal रिलीज़: 2026-05-08 GPT-5.5 GPT-5.5 none रिलीज़: 2026-04-24
स्कोर 6.1 6.3
रैंक #94 #90
विश्वसनीयता 10.0 10.0
संगति 8.8 8.8
सही परीक्षण
प्रति प्रयास पास दर 54.0% 54.0%
अस्थिर टेस्ट 3 3
कुल रन 63 63
प्रति परिणाम लागत 0.130 2.302
कुल लागत $0.013 $0.231
इनपुट कीमत $0.250 / 1M $5.000 / 1M
आउटपुट कीमत $1.500 / 1M $30.000 / 1M
कुल इनपुट टोकन 36,973 34,212
आउटपुट टोकन 2,487 1,971
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 1.33s 1.89s
प्रतिक्रिया समय (अधिकतम) 4.49s 5.56s
प्रतिक्रिया समय (कुल) 27.91s 39.64s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#94 Gemini 3.1 Flash Lite

minimal
लागत
$0.001
समय
3.7s
टोकन
635 tok

#90 GPT-5.5

none
लागत
$0.090
समय
54.3s
टोकन
3,063 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 8.3 10.0 75.0% 0 1.10s 500 639 0
GPT-5.5 6.9 7.9 66.7% 1 1.31s 606 213 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 5.5 10.0 33.3% 0 831ms 8,126 666 0
GPT-5.5 5.5 10.0 33.3% 0 1.35s 7,305 462 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 2.53s 12,870 357 0
GPT-5.5 3.0 10.0 0.0% 0 5.56s 11,019 300 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.04s 7,552 279 0
GPT-5.5 10.0 10.0 100.0% 0 1.18s 7,140 222 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 2.9 7.2 11.1% 1 1.02s 641 15 0
GPT-5.5 2.9 7.2 11.1% 1 1.31s 723 52 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 4.0 10.0 0.0% 0 791ms 490 63 0
GPT-5.5 10.0 10.0 100.0% 0 3.41s 477 124 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 932ms 615 72 0
GPT-5.5 6.2 5.8 66.7% 1 1.15s 660 81 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 6.0 4.6 66.7% 2 2.15s 564 153 0
GPT-5.5 7.7 10.0 66.7% 0 1.29s 642 252 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 3.51s 5,457 234 0
GPT-5.5 10.0 10.0 100.0% 0 3.90s 5,445 247 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 724ms 158 9 0
GPT-5.5 3.0 10.0 0.0% 0 5.01s 195 18 0

त्वरित तुलना

तुलना जोड़ी बदलें