नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Anthropic: Claude Opus 4.6 vs Google: Gemini 3.1 Flash Lite Preview

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-24

मेट्रिक Claude Opus 4.6 Claude Opus 4.6 medium रिलीज़: 2026-02-05 Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low रिलीज़: 2026-03-03
स्कोर 7.6 8.1
रैंक #45 #26
विश्वसनीयता लागू नहीं लागू नहीं
संगति 9.1 10.0
सही परीक्षण
प्रति प्रयास पास दर 70.4% 72.2%
अस्थिर टेस्ट 2 0
कुल रन 54 54
प्रति परिणाम लागत 12.047 0.168
कुल लागत $1.446 $0.022
???? ??? $5.000 / 1M $0.250 / 1M
????? ??? $25.000 / 1M $1.500 / 1M
आउटपुट टोकन 29,829 2,247
रीजनिंग टोकन 18,938 8,058
प्रतिक्रिया समय (औसत) 21.08s 3.22s
प्रतिक्रिया समय (अधिकतम) 83.40s 11.91s
प्रतिक्रिया समय (कुल) 231.84s 58.00s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 6.4 5.8 66.7% 2 7.45s 986 1,071
Gemini 3.1 Flash Lite Preview 8.3 10.0 75.0% 0 2.12s 462 1,638
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 23.11s 3,486 1,504
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 2.20s 630 372
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 76.66s 8,178 5,194
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 11.91s 225 762
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 7.37s 691 757
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.00s 291 696
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 3.0 10.0 0.0% 0 83.40s 14,642 8,687
Gemini 3.1 Flash Lite Preview 5.3 10.0 33.3% 0 2.36s 18 1,212
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 5.04s 188 292
Gemini 3.1 Flash Lite Preview 4.0 10.0 0.0% 0 1.54s 69 384
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 2.43s 266 467
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.49s 72 753
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 7.7 10.0 66.7% 0 4.60s 531 637
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 2.76s 243 1,248
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 9.73s 861 329
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 9.54s 237 993

त्वरित तुलना

तुलना जोड़ी बदलें