नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Opus 4.6 vs Google: Gemini 3.1 Pro Preview

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-29

मेट्रिक Claude Opus 4.6 Claude Opus 4.6 medium प्रकाशन: 2026-02-05 Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium प्रकाशन: 2026-02-19
स्कोअर 7.6 9.6
क्रमांक #49 #2
विश्वसनीयता लागू नाही लागू नाही
सुसंगतता 9.1 10.0
बरोबर चाचण्या
प्रति प्रयत्न पास दर 70.4% 94.4%
अस्थिर चाचण्या 2 0
एकूण रन 54 54
प्रति निकाल खर्च 12.047 3.400
एकूण खर्च $1.446 $0.578
???? ??? $5.000 / 1M $2.000 / 1M
????? ??? $25.000 / 1M $12.000 / 1M
आउटपुट टोकन्स 29,829 1,932
रिझनिंग टोकन्स 18,938 40,542
प्रतिसाद वेळ (सरासरी) 21.08s 15.96s
प्रतिसाद वेळ (कमाल) 83.40s 40.61s
प्रतिसाद वेळ (एकूण) 231.84s 175.52s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 6.4 5.8 66.7% 2 7.45s 986 1,071
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.90s 112 3,218
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 23.11s 3,486 1,504
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 19.88s 405 4,201
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 76.66s 8,178 5,194
Gemini 3.1 Pro Preview 9.5 10.0 100.0% 0 40.61s 432 9,281
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 7.37s 691 757
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.72s 279 3,904
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 3.0 10.0 0.0% 0 83.40s 14,642 8,687
Gemini 3.1 Pro Preview 7.7 10.0 66.7% 0 32.73s 18 12,424
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 5.04s 188 292
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 11.77s 108 1,179
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 2.43s 266 467
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 9.56s 72 2,236
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 7.7 10.0 66.7% 0 4.60s 531 637
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.15s 232 3,117
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 9.73s 861 329
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 23.15s 274 982

झटपट तुलना

तुलना जोडी बदला