नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Sonnet 5 vs Google: Gemini 3.1 Flash Lite Preview

सारांश

Claude Sonnet 5 vs Gemini 3.1 Flash Lite Preview benchmark तुलना: Gemini 3.1 Flash Lite Preview average score मध्ये पुढे आहे: 6.5 vs 5.7. Gemini 3.1 Flash Lite Preview चा benchmark खर्च कमी आहे: $0.026 vs $0.287. Gemini 3.1 Flash Lite Preview वेगवान आहे: 2.77s vs 4.74s, pass rates 42.9% vs 61.9%.

शिफारस केलेले मॉडेल: Gemini 3.1 Flash Lite Preview - It has the best score here (6.5), while costing about 11.3x less than Claude Sonnet 5.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-30

मेट्रिक Claude Sonnet 5 Claude Sonnet 5 none प्रकाशन: 2026-06-30 Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low प्रकाशन: 2026-03-03
स्कोअर 5.7 6.5
क्रमांक #117 #84
विश्वसनीयता 10.0 10.0
सुसंगतता 8.6 10.0
बरोबर चाचण्या
प्रति प्रयत्न पास दर 42.9% 61.9%
अस्थिर चाचण्या 4 0
एकूण रन 63 63
प्रति निकाल खर्च 4.098 0.196
एकूण खर्च $0.287 $0.026
इनपुट किंमत $2.000 / 1M $0.250 / 1M
आउटपुट किंमत $10.000 / 1M $1.500 / 1M
एकूण इनपुट टोकन्स 76,797 32,715
आउटपुट टोकन्स 13,325 2,286
रिझनिंग टोकन्स 0 9,166
प्रतिसाद वेळ (सरासरी) 4.74s 2.77s
प्रतिसाद वेळ (कमाल) 29.46s 11.91s
प्रतिसाद वेळ (एकूण) 99.46s 58.12s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#117 Claude Sonnet 5

none
खर्च
$0.061
वेळ
53.7s
टोकन्स
6,172 tok

#84 Gemini 3.1 Flash Lite Preview

low
खर्च
$0.002
वेळ
3.7s
टोकन्स
1,203 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 5 5.3 10.0 25.0% 0 3.60s 834 1,813 0
Gemini 3.1 Flash Lite Preview 8.3 10.0 75.0% 0 2.12s 506 462 1,638
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 5 4.6 7.9 22.2% 1 3.67s 10,590 1,864 0
Gemini 3.1 Flash Lite Preview 5.5 10.0 33.3% 0 1.39s 8,138 660 1,060
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 5 3.0 10.0 0.0% 0 29.46s 38,775 6,340 0
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 11.91s 8,381 225 762
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 5 10.0 10.0 100.0% 0 3.01s 10,503 309 0
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.00s 7,455 291 696
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 5 5.3 7.2 44.4% 1 3.28s 975 933 0
Gemini 3.1 Flash Lite Preview 5.3 10.0 33.3% 0 2.36s 641 18 1,212
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 5 4.7 3.1 33.3% 1 2.81s 708 272 0
Gemini 3.1 Flash Lite Preview 4.0 10.0 0.0% 0 1.54s 490 69 384
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 5 6.4 10.0 50.0% 0 2.58s 909 103 0
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.49s 621 72 753
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 5 6.0 7.4 55.6% 1 3.22s 894 778 0
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.69s 566 243 1,248
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 5 10.0 10.0 100.0% 0 6.80s 12,351 522 0
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 9.54s 5,757 237 993
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 5 3.0 10.0 0.0% 0 4.31s 258 391 0
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 1.35s 160 9 420

झटपट तुलना

तुलना जोडी बदला