नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Anthropic: Claude Sonnet 4.6 vs Google: Gemini 3.1 Flash Lite

सारांश

Claude Sonnet 4.6 vs Gemini 3.1 Flash Lite benchmark तुलना: Gemini 3.1 Flash Lite average score में आगे है: 7.8 vs 7.3. Gemini 3.1 Flash Lite की benchmark लागत कम है: $0.071 vs $0.316. Gemini 3.1 Flash Lite तेज है: 3.23s vs 5.04s, pass rates 55.6% vs 65.1%.

अनुशंसित मॉडल: Gemini 3.1 Flash Lite - It has the best score here (7.8), while costing about 4.5x less than Claude Sonnet 4.6.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक Claude Sonnet 4.6 Claude Sonnet 4.6 none रिलीज़: 2026-02-17 Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite medium रिलीज़: 2026-05-08
स्कोर 7.3 7.8
रैंक #55 #34
विश्वसनीयता 10.0 10.0
संगति 9.7 9.2
सही परीक्षण
प्रति प्रयास पास दर 55.6% 65.1%
अस्थिर टेस्ट 1 2
कुल रन 63 63
प्रति परिणाम लागत 2.870 0.539
कुल लागत $0.316 $0.071
इनपुट कीमत $3.000 / 1M $0.250 / 1M
आउटपुट कीमत $15.000 / 1M $1.500 / 1M
कुल इनपुट टोकन 57,886 36,808
आउटपुट टोकन 9,465 2,254
रीजनिंग टोकन 0 38,300
प्रतिक्रिया समय (औसत) 5.04s 3.23s
प्रतिक्रिया समय (अधिकतम) 23.84s 10.87s
प्रतिक्रिया समय (कुल) 70.60s 67.80s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#55 Claude Sonnet 4.6

none
लागत
$0.038
समय
27.3s
टोकन
2,598 tok

#34 Gemini 3.1 Flash Lite

medium
लागत
$0.003
समय
5.3s
टोकन
1,754 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 4.8 10.0 25.0% 0 2.94s 636 1,214 0
Gemini 3.1 Flash Lite 9.1 10.0 75.0% 0 2.39s 502 604 4,201
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 5.5 10.0 33.3% 0 5.19s 8,522 2,127 0
Gemini 3.1 Flash Lite 5.5 10.0 33.3% 0 3.81s 8,134 459 8,978
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 9.5 10.0 100.0% 0 23.84s 26,024 3,766 0
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 10.87s 12,873 327 7,401
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.43s 8,574 252 0
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 2.60s 7,362 279 2,845
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 7.7 10.0 66.7% 0 3.54s 759 413 0
Gemini 3.1 Flash Lite 2.9 7.2 11.1% 1 3.16s 643 15 5,165
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 6.1 3.1 66.7% 1 2.56s 513 192 0
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 2.60s 488 84 1,142
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 6.5 10.0 50.0% 0 1.96s 690 90 0
Gemini 3.1 Flash Lite 9.9 10.0 100.0% 0 2.59s 623 75 3,320
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 7.7 10.0 66.7% 0 2.53s 663 533 0
Gemini 3.1 Flash Lite 7.6 7.2 77.8% 1 1.95s 568 165 2,450
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.11s 11,301 447 0
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 4.55s 5,457 234 921
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 3.0 10.0 0.0% 0 4.67s 204 431 0
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 3.08s 158 12 1,877

त्वरित तुलना

तुलना जोड़ी बदलें