नेव्हिगेशन
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Opus 4.6 vs Google: Gemini 3.1 Flash Lite

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-19

मेट्रिक Claude Opus 4.6 Claude Opus 4.6 medium प्रकाशन: 2026-02-05 Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite minimal प्रकाशन: 2026-05-08
स्कोअर 7.4 6.8
क्रमांक #57 #75
विश्वसनीयता 10.0 10.0
सुसंगतता 9.1 8.7
बरोबर चाचण्या
प्रति प्रयत्न पास दर 66.7% 59.7%
अस्थिर चाचण्या 2 3
एकूण रन 57 57
प्रति निकाल खर्च 14.243 0.111
एकूण खर्च $1.710 $0.012
???? ??? $5.000 / 1M $0.250 / 1M
????? ??? $25.000 / 1M $1.500 / 1M
आउटपुट टोकन्स 37,874 2,457
रिझनिंग टोकन्स 21,390 0
प्रतिसाद वेळ (सरासरी) 24.59s 1.41s
प्रतिसाद वेळ (कमाल) 83.40s 4.49s
प्रतिसाद वेळ (एकूण) 295.08s 26.72s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 6.4 5.8 66.7% 2 7.45s 986 1,071
Gemini 3.1 Flash Lite 8.3 10.0 75.0% 0 1.10s 639 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 23.11s 3,486 1,504
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.31s 636 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 76.66s 8,178 5,194
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 2.53s 357 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 7.37s 691 757
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.04s 279 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 3.0 10.0 0.0% 0 83.40s 14,642 8,687
Gemini 3.1 Flash Lite 2.9 7.2 11.1% 1 1.02s 15 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 5.04s 188 292
Gemini 3.1 Flash Lite 4.0 10.0 0.0% 0 791ms 63 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 2.43s 266 467
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 932ms 72 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 7.7 10.0 66.7% 0 4.60s 531 637
Gemini 3.1 Flash Lite 6.0 4.6 66.7% 2 2.15s 153 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 9.73s 861 329
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 3.51s 234 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 3.0 10.0 0.0% 0 63.24s 8,045 2,452
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 724ms 9 0

झटपट तुलना

तुलना जोडी बदला