नेव्हिगेशन
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite vs OpenAI: GPT-5.4 Mini

सारांश

Gemini 3.1 Flash Lite vs GPT-5.4 Mini benchmark तुलना: Gemini 3.1 Flash Lite average score मध्ये पुढे आहे: 6.1 vs 5.3. Gemini 3.1 Flash Lite चा benchmark खर्च कमी आहे: $0.013 vs $0.038. GPT-5.4 Mini वेगवान आहे: 1.13s vs 1.33s, pass rates 54.0% vs 30.2%.

शिफारस केलेले मॉडेल: Gemini 3.1 Flash Lite - It has the best score here (6.1), while costing about 2.9x less than GPT-5.4 Mini.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-12

मेट्रिक Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite minimal प्रकाशन: 2026-05-08 GPT-5.4 Mini GPT-5.4 Mini none प्रकाशन: 2026-03-17
स्कोअर 6.1 5.3
क्रमांक #95 #131
विश्वसनीयता 10.0 10.0
सुसंगतता 8.8 8.8
बरोबर चाचण्या
प्रति प्रयत्न पास दर 54.0% 30.2%
अस्थिर चाचण्या 3 3
एकूण रन 63 63
प्रति निकाल खर्च 0.130 0.743
एकूण खर्च $0.013 $0.038
इनपुट किंमत $0.250 / 1M $0.750 / 1M
आउटपुट किंमत $1.500 / 1M $4.500 / 1M
एकूण इनपुट टोकन्स 36,973 34,244
आउटपुट टोकन्स 2,487 2,541
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 1.33s 1.13s
प्रतिसाद वेळ (कमाल) 4.49s 2.52s
प्रतिसाद वेळ (एकूण) 27.91s 23.82s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#95 Gemini 3.1 Flash Lite

minimal
Cost
$0.001
Time
3.7s
Tokens
635 tok

#131 GPT-5.4 Mini

none
Cost
$0.010
Time
11.7s
Tokens
2,151 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite 8.3 10.0 75.0% 0 1.10s 500 639 0
GPT-5.4 Mini 3.1 8.1 8.3% 1 929ms 606 654 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite 5.5 10.0 33.3% 0 831ms 8,126 666 0
GPT-5.4 Mini 5.5 10.0 33.3% 0 913ms 7,305 401 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 2.53s 12,870 357 0
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.52s 11,019 298 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.04s 7,552 279 0
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.30s 7,140 222 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite 2.9 7.2 11.1% 1 1.02s 641 15 0
GPT-5.4 Mini 3.5 4.4 33.3% 2 937ms 723 88 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite 4.0 10.0 0.0% 0 791ms 490 63 0
GPT-5.4 Mini 4.8 10.0 0.0% 0 1.82s 477 174 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 932ms 615 72 0
GPT-5.4 Mini 6.3 10.0 50.0% 0 728ms 660 101 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite 6.0 4.6 66.7% 2 2.15s 564 153 0
GPT-5.4 Mini 5.4 10.0 33.3% 0 836ms 642 305 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 3.51s 5,457 234 0
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.32s 5,477 255 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 724ms 158 9 0
GPT-5.4 Mini 3.0 10.0 0.0% 0 1.33s 195 43 0

झटपट तुलना

तुलना जोडी बदला