नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Opus 4.8 vs Google: Gemini 3.1 Pro Preview

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-29

मेट्रिक Claude Opus 4.8 Claude Opus 4.8 none प्रकाशन: 2026-05-28 Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium प्रकाशन: 2026-02-19
स्कोअर 7.3 9.3
क्रमांक #65 #4
विश्वसनीयता 10.0 10.0
सुसंगतता 9.2 10.0
बरोबर चाचण्या
प्रति प्रयत्न पास दर 65.0% 90.0%
अस्थिर चाचण्या 2 0
एकूण रन 60 60
प्रति निकाल खर्च 4.324 5.587
एकूण खर्च $0.519 $1.006
इनपुट किंमत $5.000 / 1M $2.000 / 1M
आउटपुट किंमत $25.000 / 1M $12.000 / 1M
आउटपुट टोकन्स 8,098 1,971
रिझनिंग टोकन्स 0 75,384
प्रतिसाद वेळ (सरासरी) 3.51s 20.77s
प्रतिसाद वेळ (कमाल) 17.73s 88.68s
प्रतिसाद वेळ (एकूण) 70.19s 269.96s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 6.5 10.0 50.0% 0 3.40s 1,472 0
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.90s 112 3,218
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 6.8 10.0 50.0% 0 3.59s 1,323 0
Gemini 3.1 Pro Preview 7.0 9.8 50.0% 0 54.28s 429 37,735
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 9.5 10.0 100.0% 0 17.73s 3,259 0
Gemini 3.1 Pro Preview 9.5 10.0 100.0% 0 40.61s 432 9,281
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 7.3 5.8 83.3% 1 1.77s 308 0
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.72s 279 3,904
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 5.3 7.2 44.4% 1 1.66s 61 0
Gemini 3.1 Pro Preview 7.7 10.0 66.7% 0 32.73s 18 12,424
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 3.48s 230 0
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 11.77s 108 1,179
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 9.9 10.0 100.0% 0 1.37s 95 0
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 9.56s 72 2,236
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 7.7 10.0 66.7% 0 2.74s 783 0
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 6.90s 235 3,128
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 5.35s 355 0
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 23.15s 274 982
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 3.0 10.0 0.0% 0 3.41s 212 0
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 6.27s 12 1,297

झटपट तुलना

तुलना जोडी बदला