नेव्हिगेशन
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Opus 4.8 vs Google: Gemini 2.5 Flash

सारांश

Claude Opus 4.8 vs Gemini 2.5 Flash benchmark तुलना: Gemini 2.5 Flash average score मध्ये पुढे आहे: 8.2 vs 7.7. Gemini 2.5 Flash चा benchmark खर्च कमी आहे: $0.379 vs $1.270. Claude Opus 4.8 वेगवान आहे: 10.83s vs 15.49s, pass rates 79.4% vs 69.8%.

शिफारस केलेले मॉडेल: Gemini 2.5 Flash - It has the best score here (8.2), while costing about 3.4x less than Claude Opus 4.8.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-07-02

मेट्रिक Claude Opus 4.8 Claude Opus 4.8 low प्रकाशन: 2026-05-28 Gemini 2.5 Flash Gemini 2.5 Flash medium प्रकाशन: 2025-06-17
स्कोअर 7.7 8.2
क्रमांक #38 #24
विश्वसनीयता 10.0 10.0
सुसंगतता 8.8 9.6
बरोबर चाचण्या
प्रति प्रयत्न पास दर 79.4% 69.8%
अस्थिर चाचण्या 3 1
एकूण रन 63 63
प्रति निकाल खर्च 8.466 2.701
एकूण खर्च $1.270 $0.379
इनपुट किंमत $5.000 / 1M $0.300 / 1M
आउटपुट किंमत $25.000 / 1M $2.500 / 1M
एकूण इनपुट टोकन्स 60,946 34,476
आउटपुट टोकन्स 31,771 1,930
रिझनिंग टोकन्स 6,831 145,145
प्रतिसाद वेळ (सरासरी) 10.83s 15.49s
प्रतिसाद वेळ (कमाल) 127.97s 95.48s
प्रतिसाद वेळ (एकूण) 227.39s 325.39s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#38 Claude Opus 4.8

low
खर्च
$0.031
वेळ
14.1s
टोकन्स
1,345 tok

#24 Gemini 2.5 Flash

medium
अवैध SVG
खर्च
$0.000
वेळ
274.0s
टोकन्स
0 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 3.30s 834 793 371
Gemini 2.5 Flash 8.4 10.0 75.0% 0 6.30s 492 255 10,233
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 6.6 4.6 77.8% 2 7.58s 10,590 3,637 809
Gemini 2.5 Flash 7.8 10.0 66.7% 0 41.01s 6,669 543 32,303
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 9.8 10.0 100.0% 0 20.84s 23,500 2,216 1,081
Gemini 2.5 Flash 10.0 10.0 100.0% 0 28.44s 12,522 303 11,922
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 6.3 5.8 66.7% 1 2.27s 10,503 310 0
Gemini 2.5 Flash 10.0 10.0 100.0% 0 4.06s 7,257 279 2,325
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 5.3 10.0 33.3% 0 45.53s 975 23,311 3,908
Gemini 2.5 Flash 5.9 7.2 55.6% 1 37.34s 633 18 80,702
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 2.55s 708 231 0
Gemini 2.5 Flash 4.8 10.0 0.0% 0 4.86s 486 92 1,899
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 9.8 10.0 100.0% 0 2.78s 909 111 221
Gemini 2.5 Flash 9.8 10.0 100.0% 0 2.62s 615 69 1,203
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 3.01s 894 592 184
Gemini 2.5 Flash 7.7 10.0 66.7% 0 3.18s 558 126 2,499
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 6.85s 11,775 370 35
Gemini 2.5 Flash 10.0 10.0 100.0% 0 6.20s 5,088 234 1,140
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 3.0 10.0 0.0% 0 5.48s 258 200 222
Gemini 2.5 Flash 3.0 10.0 0.0% 0 2.76s 156 11 919

झटपट तुलना

तुलना जोडी बदला