नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Anthropic: Claude Opus 4.6 vs Google: Gemini 3.1 Flash Lite Preview

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-16

मेट्रिक Claude Opus 4.6 Claude Opus 4.6 medium रिलीज़: 2026-02-05 Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview none रिलीज़: 2026-03-03
स्कोर 7.6 7.9
रैंक #36 #29
संगति 9.1 9.6
सही परीक्षण
प्रति प्रयास पास दर 70.4% 70.4%
अस्थिर टेस्ट 2 1
कुल रन 54 54
प्रति परिणाम लागत 12.047 0.130
कुल लागत $1.446 $0.016
???? ??? $5.000 / 1M $0.250 / 1M
????? ??? $25.000 / 1M $1.500 / 1M
आउटपुट टोकन 29,829 5,361
रीजनिंग टोकन 18,938 0
प्रतिक्रिया समय (औसत) 21.08s 1.30s
प्रतिक्रिया समय (अधिकतम) 83.40s 3.39s
प्रतिक्रिया समय (कुल) 231.84s 23.42s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 6.4 5.8 66.7% 2 7.45s 986 1,071
Gemini 3.1 Flash Lite Preview 7.5 8.4 66.7% 1 1.04s 1,092 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 23.11s 3,486 1,504
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.47s 640 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 76.66s 8,178 5,194
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 3.20s 339 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 7.37s 691 757
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.22s 399 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 3.0 10.0 0.0% 0 83.40s 14,642 8,687
Gemini 3.1 Flash Lite Preview 5.3 10.0 33.3% 0 942ms 568 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 5.04s 188 292
Gemini 3.1 Flash Lite Preview 4.0 10.0 0.0% 0 741ms 69 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 2.43s 266 467
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.13s 574 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 7.7 10.0 66.7% 0 4.60s 531 637
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 972ms 898 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 9.73s 861 329
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.39s 782 0

त्वरित तुलना

तुलना जोड़ी बदलें