नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Anthropic: Claude Sonnet 4.6 vs Google: Gemini 2.5 Flash

सारांश

Claude Sonnet 4.6 vs Gemini 2.5 Flash benchmark तुलना: Gemini 2.5 Flash average score में आगे है: 8.2 vs 7.3. Claude Sonnet 4.6 की benchmark लागत कम है: $0.316 vs $0.379. Claude Sonnet 4.6 तेज है: 5.04s vs 15.49s, pass rates 55.6% vs 69.8%.

अनुशंसित मॉडल: Claude Sonnet 4.6 - It offers the best overall trade-off: a competitive score (7.3), lower cost than Gemini 2.5 Flash, and balanced response time.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-12

मेट्रिक Claude Sonnet 4.6 Claude Sonnet 4.6 none रिलीज़: 2026-02-17 Gemini 2.5 Flash Gemini 2.5 Flash medium रिलीज़: 2025-06-17
स्कोर 7.3 8.2
रैंक #56 #27
विश्वसनीयता 10.0 10.0
संगति 9.7 9.6
सही परीक्षण
प्रति प्रयास पास दर 55.6% 69.8%
अस्थिर टेस्ट 1 1
कुल रन 63 63
प्रति परिणाम लागत 2.870 2.701
कुल लागत $0.316 $0.379
इनपुट कीमत $3.000 / 1M $0.300 / 1M
आउटपुट कीमत $15.000 / 1M $2.500 / 1M
कुल इनपुट टोकन 57,886 34,476
आउटपुट टोकन 9,465 1,930
रीजनिंग टोकन 0 145,145
प्रतिक्रिया समय (औसत) 5.04s 15.49s
प्रतिक्रिया समय (अधिकतम) 23.84s 95.48s
प्रतिक्रिया समय (कुल) 70.60s 325.39s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#56 Claude Sonnet 4.6

none
Cost
$0.038
Time
27.3s
Tokens
2,598 tok

#27 Gemini 2.5 Flash

medium
Invalid SVG
Cost
$0.000
Time
274.0s
Tokens
0 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 4.8 10.0 25.0% 0 2.94s 636 1,214 0
Gemini 2.5 Flash 8.4 10.0 75.0% 0 6.30s 492 255 10,233
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 5.5 10.0 33.3% 0 5.19s 8,522 2,127 0
Gemini 2.5 Flash 7.8 10.0 66.7% 0 41.01s 6,669 543 32,303
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 9.5 10.0 100.0% 0 23.84s 26,024 3,766 0
Gemini 2.5 Flash 10.0 10.0 100.0% 0 28.44s 12,522 303 11,922
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.43s 8,574 252 0
Gemini 2.5 Flash 10.0 10.0 100.0% 0 4.06s 7,257 279 2,325
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 7.7 10.0 66.7% 0 3.54s 759 413 0
Gemini 2.5 Flash 5.9 7.2 55.6% 1 37.34s 633 18 80,702
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 6.1 3.1 66.7% 1 2.56s 513 192 0
Gemini 2.5 Flash 4.8 10.0 0.0% 0 4.86s 486 92 1,899
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 6.5 10.0 50.0% 0 1.96s 690 90 0
Gemini 2.5 Flash 9.8 10.0 100.0% 0 2.62s 615 69 1,203
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 7.7 10.0 66.7% 0 2.53s 663 533 0
Gemini 2.5 Flash 7.7 10.0 66.7% 0 3.18s 558 126 2,499
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.11s 11,301 447 0
Gemini 2.5 Flash 10.0 10.0 100.0% 0 6.20s 5,088 234 1,140
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 3.0 10.0 0.0% 0 4.67s 204 431 0
Gemini 2.5 Flash 3.0 10.0 0.0% 0 2.76s 156 11 919

त्वरित तुलना

तुलना जोड़ी बदलें