नेव्हिगेशन
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Sonnet 5 vs Google: Gemini 2.5 Flash

सारांश

Claude Sonnet 5 vs Gemini 2.5 Flash benchmark तुलना: Gemini 2.5 Flash average score मध्ये पुढे आहे: 6.2 vs 5.7. Gemini 2.5 Flash चा benchmark खर्च कमी आहे: $0.016 vs $0.287. Gemini 2.5 Flash वेगवान आहे: 875ms vs 4.74s, pass rates 42.9% vs 46.0%.

शिफारस केलेले मॉडेल: Gemini 2.5 Flash - It has the best score here (6.2), while costing about 18.9x less than Claude Sonnet 5.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-30

मेट्रिक Claude Sonnet 5 Claude Sonnet 5 none प्रकाशन: 2026-06-30 Gemini 2.5 Flash Gemini 2.5 Flash none प्रकाशन: 2025-06-17
स्कोअर 5.7 6.2
क्रमांक #117 #95
विश्वसनीयता 10.0 10.0
सुसंगतता 8.6 9.6
बरोबर चाचण्या
प्रति प्रयत्न पास दर 42.9% 46.0%
अस्थिर चाचण्या 4 1
एकूण रन 63 63
प्रति निकाल खर्च 4.098 0.169
एकूण खर्च $0.287 $0.016
इनपुट किंमत $2.000 / 1M $0.300 / 1M
आउटपुट किंमत $10.000 / 1M $2.500 / 1M
एकूण इनपुट टोकन्स 76,797 35,926
आउटपुट टोकन्स 13,325 1,770
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 4.74s 875ms
प्रतिसाद वेळ (कमाल) 29.46s 4.39s
प्रतिसाद वेळ (एकूण) 99.46s 18.37s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#117 Claude Sonnet 5

none
खर्च
$0.061
वेळ
53.7s
टोकन्स
6,172 tok

#95 Gemini 2.5 Flash

none
अवैध SVG
खर्च
$0.164
वेळ
215.5s
टोकन्स
65,659 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 5 5.3 10.0 25.0% 0 3.60s 834 1,813 0
Gemini 2.5 Flash 3.0 10.0 0.0% 0 582ms 492 102 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 5 4.6 7.9 22.2% 1 3.67s 10,590 1,864 0
Gemini 2.5 Flash 5.5 10.0 33.3% 0 736ms 8,122 483 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 5 3.0 10.0 0.0% 0 29.46s 38,775 6,340 0
Gemini 2.5 Flash 3.0 10.0 0.0% 0 4.39s 12,519 366 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 5 10.0 10.0 100.0% 0 3.01s 10,503 309 0
Gemini 2.5 Flash 10.0 10.0 100.0% 0 652ms 7,257 279 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 5 5.3 7.2 44.4% 1 3.28s 975 933 0
Gemini 2.5 Flash 5.9 7.2 55.6% 1 495ms 633 12 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 5 4.7 3.1 33.3% 1 2.81s 708 272 0
Gemini 2.5 Flash 5.0 10.0 0.0% 0 615ms 486 78 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 5 6.4 10.0 50.0% 0 2.58s 909 103 0
Gemini 2.5 Flash 10.0 10.0 100.0% 0 590ms 615 72 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 5 6.0 7.4 55.6% 1 3.22s 894 778 0
Gemini 2.5 Flash 7.7 10.0 66.7% 0 604ms 558 132 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 5 10.0 10.0 100.0% 0 6.80s 12,351 522 0
Gemini 2.5 Flash 10.0 10.0 100.0% 0 1.91s 5,088 234 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 5 3.0 10.0 0.0% 0 4.31s 258 391 0
Gemini 2.5 Flash 3.0 10.0 0.0% 0 1.15s 156 12 0

झटपट तुलना

तुलना जोडी बदला