नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Anthropic: Claude Opus 4.8 vs Google: Gemini 3.1 Flash Lite

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-28

मेट्रिक Claude Opus 4.8 Claude Opus 4.8 none रिलीज़: 2026-05-28 Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite low रिलीज़: 2026-05-08
स्कोर 7.3 7.4
रैंक #63 #54
विश्वसनीयता 10.0 10.0
संगति 9.2 9.2
सही परीक्षण
प्रति प्रयास पास दर 65.0% 65.0%
अस्थिर टेस्ट 2 2
कुल रन 60 60
प्रति परिणाम लागत 4.324 0.217
कुल लागत $0.519 $0.026
इनपुट कीमत $5.000 / 1M $0.250 / 1M
आउटपुट कीमत $25.000 / 1M $1.500 / 1M
आउटपुट टोकन 8,098 2,726
रीजनिंग टोकन 0 8,951
प्रतिक्रिया समय (औसत) 3.51s 1.92s
प्रतिक्रिया समय (अधिकतम) 17.73s 5.66s
प्रतिक्रिया समय (कुल) 70.19s 38.45s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 6.5 10.0 50.0% 0 3.40s 1,472 0
Gemini 3.1 Flash Lite 7.3 6.2 75.0% 2 1.84s 1,013 1,548
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 6.8 10.0 50.0% 0 3.59s 1,323 0
Gemini 3.1 Flash Lite 6.8 10.0 50.0% 0 1.71s 465 763
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 9.5 10.0 100.0% 0 17.73s 3,259 0
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 4.48s 348 975
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 7.3 5.8 83.3% 1 1.77s 308 0
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.44s 291 697
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 5.3 7.2 44.4% 1 1.66s 61 0
Gemini 3.1 Flash Lite 5.3 10.0 33.3% 0 1.52s 15 1,214
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 3.48s 230 0
Gemini 3.1 Flash Lite 4.0 10.0 0.0% 0 1.37s 69 438
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 9.9 10.0 100.0% 0 1.37s 95 0
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.52s 72 760
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 7.7 10.0 66.7% 0 2.74s 783 0
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.40s 210 1,191
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 5.35s 355 0
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 5.66s 234 945
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 3.0 10.0 0.0% 0 3.41s 212 0
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 1.46s 9 420

त्वरित तुलना

तुलना जोड़ी बदलें