नेव्हिगेशन
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Opus 4.8 vs Google: Gemini 3.1 Flash Lite Preview

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-28

मेट्रिक Claude Opus 4.8 Claude Opus 4.8 medium प्रकाशन: 2026-05-28 Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low प्रकाशन: 2026-03-03
स्कोअर 8.7 7.6
क्रमांक #12 #47
विश्वसनीयता 10.0 10.0
सुसंगतता 9.6 10.0
बरोबर चाचण्या
प्रति प्रयत्न पास दर 83.3% 65.0%
अस्थिर चाचण्या 1 0
एकूण रन 60 60
प्रति निकाल खर्च 6.285 0.186
एकूण खर्च $1.006 $0.025
इनपुट किंमत $5.000 / 1M $0.250 / 1M
आउटपुट किंमत $25.000 / 1M $1.500 / 1M
आउटपुट टोकन्स 23,201 2,280
रिझनिंग टोकन्स 5,901 8,829
प्रतिसाद वेळ (सरासरी) 9.34s 2.85s
प्रतिसाद वेळ (कमाल) 38.03s 11.91s
प्रतिसाद वेळ (एकूण) 186.84s 57.08s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 3.95s 1,179 478
Gemini 3.1 Flash Lite Preview 8.3 10.0 75.0% 0 2.12s 462 1,638
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 14.97s 6,651 1,381
Gemini 3.1 Flash Lite Preview 6.8 10.0 50.0% 0 1.56s 654 723
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 9.8 10.0 100.0% 0 38.03s 5,260 1,588
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 11.91s 225 762
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 7.1 5.6 83.3% 1 12.29s 481 312
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.00s 291 696
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 5.3 10.0 33.3% 0 14.15s 7,477 900
Gemini 3.1 Flash Lite Preview 5.3 10.0 33.3% 0 2.36s 18 1,212
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 2.46s 237 0
Gemini 3.1 Flash Lite Preview 4.0 10.0 0.0% 0 1.54s 69 384
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 3.32s 373 320
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.49s 72 753
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 3.95s 791 483
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.69s 243 1,248
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 8.96s 301 225
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 9.54s 237 993
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 3.0 10.0 0.0% 0 6.14s 451 214
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 1.35s 9 420

झटपट तुलना

तुलना जोडी बदला