नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Google: Gemini 3.5 Flash vs OpenAI: GPT-5.5

सारांश

Gemini 3.5 Flash vs GPT-5.5 benchmark तुलना: GPT-5.5 average score में आगे है: 9.3 vs 9.1. Gemini 3.5 Flash की benchmark लागत कम है: $0.582 vs $0.907. Gemini 3.5 Flash तेज है: 4.94s vs 9.76s, pass rates 87.3% vs 85.7%.

अनुशंसित मॉडल: Gemini 3.5 Flash - Its score stays close to the best score here (9.1 vs 9.3), while costing about 1.6x less than GPT-5.5.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-07-02

मेट्रिक Gemini 3.5 Flash Gemini 3.5 Flash medium रिलीज़: 2026-05-19 GPT-5.5 GPT-5.5 low रिलीज़: 2026-04-24
स्कोर 9.1 9.3
रैंक #8 #4
विश्वसनीयता 10.0 10.0
संगति 9.6 10.0
सही परीक्षण
प्रति प्रयास पास दर 87.3% 85.7%
अस्थिर टेस्ट 1 0
कुल रन 63 63
प्रति परिणाम लागत 3.229 5.035
कुल लागत $0.582 $0.907
इनपुट कीमत $1.500 / 1M $5.000 / 1M
आउटपुट कीमत $9.000 / 1M $30.000 / 1M
कुल इनपुट टोकन 36,936 34,209
आउटपुट टोकन 2,001 2,046
रीजनिंग टोकन 56,408 22,460
प्रतिक्रिया समय (औसत) 4.94s 9.76s
प्रतिक्रिया समय (अधिकतम) 18.07s 56.19s
प्रतिक्रिया समय (कुल) 103.79s 204.92s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#8 Gemini 3.5 Flash

medium
लागत
$0.201
समय
112.9s
टोकन
22,371 tok

#4 GPT-5.5

low
लागत
$0.068
समय
37.0s
टोकन
2,339 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.09s 492 171 3,385
GPT-5.5 10.0 10.0 100.0% 0 4.41s 606 238 1,020
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 7.9 7.5 77.8% 1 12.63s 8,118 461 24,939
GPT-5.5 10.0 10.0 100.0% 0 15.04s 7,302 423 6,402
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 12.05s 12,873 351 7,807
GPT-5.5 10.0 10.0 100.0% 0 9.56s 11,019 303 717
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 4.07s 7,548 279 3,784
GPT-5.5 10.0 10.0 100.0% 0 3.28s 7,140 228 157
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 7.7 10.0 66.7% 0 5.24s 633 12 8,047
GPT-5.5 5.3 10.0 33.3% 0 28.05s 723 69 11,609
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.52s 486 115 1,144
GPT-5.5 10.0 10.0 100.0% 0 5.17s 477 133 245
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 9.9 10.0 100.0% 0 2.70s 615 71 2,855
GPT-5.5 9.9 10.0 100.0% 0 3.74s 660 93 415
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 7.7 10.0 66.7% 0 2.38s 558 295 2,747
GPT-5.5 10.0 10.0 100.0% 0 4.74s 642 279 954
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.81s 5,457 234 455
GPT-5.5 10.0 10.0 100.0% 0 4.96s 5,445 250 101
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.75s 156 12 1,245
GPT-5.5 3.0 10.0 0.0% 0 10.06s 195 30 840

त्वरित तुलना

तुलना जोड़ी बदलें