नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Google: Gemini 3.1 Flash Lite vs OpenAI: GPT-5.5

सारांश

Gemini 3.1 Flash Lite vs GPT-5.5 benchmark तुलना: GPT-5.5 average score में आगे है: 9.3 vs 6.1. Gemini 3.1 Flash Lite की benchmark लागत कम है: $0.013 vs $0.907. Gemini 3.1 Flash Lite तेज है: 1.06s vs 9.76s, pass rates 52.4% vs 85.7%.

अनुशंसित मॉडल: GPT-5.5 - It has the strongest score in this comparison (9.3) and the best overall balance of cost and response time across all 2 models.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite none रिलीज़: 2026-05-08 GPT-5.5 GPT-5.5 low रिलीज़: 2026-04-24
स्कोर 6.1 9.3
रैंक #96 #4
विश्वसनीयता 10.0 10.0
संगति 8.6 10.0
सही परीक्षण
प्रति प्रयास पास दर 52.4% 85.7%
अस्थिर टेस्ट 4 0
कुल रन 63 63
प्रति परिणाम लागत 0.144 5.035
कुल लागत $0.013 $0.907
इनपुट कीमत $0.250 / 1M $5.000 / 1M
आउटपुट कीमत $1.500 / 1M $30.000 / 1M
कुल इनपुट टोकन 36,710 34,209
आउटपुट टोकन 2,484 2,046
रीजनिंग टोकन 0 22,460
प्रतिक्रिया समय (औसत) 1.06s 9.76s
प्रतिक्रिया समय (अधिकतम) 2.97s 56.19s
प्रतिक्रिया समय (कुल) 22.35s 204.92s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#96 Gemini 3.1 Flash Lite

none
लागत
$0.001
समय
4.5s
टोकन
727 tok

#4 GPT-5.5

low
लागत
$0.068
समय
37.0s
टोकन
2,339 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 7.5 8.4 66.7% 1 1.07s 506 639 0
GPT-5.5 10.0 10.0 100.0% 0 4.41s 606 238 1,020
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 5.5 10.0 33.3% 0 938ms 8,128 666 0
GPT-5.5 10.0 10.0 100.0% 0 15.04s 7,302 423 6,402
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 2.73s 12,870 357 0
GPT-5.5 10.0 10.0 100.0% 0 9.56s 11,019 303 717
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 843ms 7,267 279 0
GPT-5.5 10.0 10.0 100.0% 0 3.28s 7,140 228 157
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 2.9 7.2 11.1% 1 762ms 647 15 0
GPT-5.5 5.3 10.0 33.3% 0 28.05s 723 69 11,609
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 4.0 10.0 0.0% 0 992ms 486 63 0
GPT-5.5 10.0 10.0 100.0% 0 5.17s 477 133 245
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 859ms 619 72 0
GPT-5.5 9.9 10.0 100.0% 0 3.74s 660 93 415
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 6.3 4.8 66.7% 2 720ms 570 150 0
GPT-5.5 10.0 10.0 100.0% 0 4.74s 642 279 954
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 2.97s 5,457 234 0
GPT-5.5 10.0 10.0 100.0% 0 4.96s 5,445 250 101
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 733ms 160 9 0
GPT-5.5 3.0 10.0 0.0% 0 10.06s 195 30 840

त्वरित तुलना

तुलना जोड़ी बदलें