नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Opus 4.8 vs Google: Gemini 3 Flash Preview

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-28

मेट्रिक Claude Opus 4.8 Claude Opus 4.8 none प्रकाशन: 2026-05-28 Gemini 3 Flash Preview Gemini 3 Flash Preview medium प्रकाशन: 2025-12-17
स्कोअर 7.3 9.8
क्रमांक #63 #1
विश्वसनीयता 10.0 10.0
सुसंगतता 9.2 9.6
बरोबर चाचण्या
प्रति प्रयत्न पास दर 65.0% 98.3%
अस्थिर चाचण्या 2 1
एकूण रन 60 60
प्रति निकाल खर्च 4.324 2.980
एकूण खर्च $0.519 $0.567
इनपुट किंमत $5.000 / 1M $0.500 / 1M
आउटपुट किंमत $25.000 / 1M $3.000 / 1M
आउटपुट टोकन्स 8,098 2,000
रिझनिंग टोकन्स 0 181,033
प्रतिसाद वेळ (सरासरी) 3.51s 16.50s
प्रतिसाद वेळ (कमाल) 17.73s 117.26s
प्रतिसाद वेळ (एकूण) 70.19s 330.06s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 6.5 10.0 50.0% 0 3.40s 1,472 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.88s 330 3,216
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 6.8 10.0 50.0% 0 3.59s 1,323 0
Gemini 3 Flash Preview 7.9 6.4 83.3% 1 95.96s 456 127,964
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 9.5 10.0 100.0% 0 17.73s 3,259 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 22.42s 351 10,485
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 7.3 5.8 83.3% 1 1.77s 308 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.43s 279 4,893
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 5.3 7.2 44.4% 1 1.66s 61 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 15.27s 12 21,684
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 3.48s 230 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.19s 72 1,905
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 9.9 10.0 100.0% 0 1.37s 95 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.04s 72 2,709
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 7.7 10.0 66.7% 0 2.74s 783 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.05s 183 4,365
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 5.35s 355 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 12.60s 234 1,487
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 3.0 10.0 0.0% 0 3.41s 212 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.50s 11 2,325

झटपट तुलना

तुलना जोडी बदला