नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Opus 4.6 vs Google: Gemini 3 Flash Preview

सारांश

Claude Opus 4.6 vs Gemini 3 Flash Preview benchmark तुलना: Gemini 3 Flash Preview average score मध्ये पुढे आहे: 9.6 vs 7.7. Gemini 3 Flash Preview चा benchmark खर्च कमी आहे: $0.667 vs $2.053. Gemini 3 Flash Preview वेगवान आहे: 18.64s vs 25.89s, pass rates 61.9% vs 98.4%.

शिफारस केलेले मॉडेल: Gemini 3 Flash Preview - It has the best score here (9.6), while costing about 3.1x less than Claude Opus 4.6.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-07-02

मेट्रिक Claude Opus 4.6 Claude Opus 4.6 medium प्रकाशन: 2026-02-05 Gemini 3 Flash Preview Gemini 3 Flash Preview medium प्रकाशन: 2025-12-17
स्कोअर 7.7 9.6
क्रमांक #40 #2
विश्वसनीयता 10.0 10.0
सुसंगतता 8.8 9.7
बरोबर चाचण्या
प्रति प्रयत्न पास दर 61.9% 98.4%
अस्थिर चाचण्या 3 1
एकूण रन 63 63
प्रति निकाल खर्च 17.103 3.335
एकूण खर्च $2.053 $0.667
इनपुट किंमत $5.000 / 1M $0.500 / 1M
आउटपुट किंमत $25.000 / 1M $3.000 / 1M
एकूण इनपुट टोकन्स 53,227 37,017
आउटपुट टोकन्स 47,446 2,006
रिझनिंग टोकन्स 24,000 214,153
प्रतिसाद वेळ (सरासरी) 25.89s 18.64s
प्रतिसाद वेळ (कमाल) 83.40s 117.26s
प्रतिसाद वेळ (एकूण) 362.49s 391.35s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#40 Claude Opus 4.6

medium
अवैध SVG
खर्च
$0.000
वेळ
300.0s
टोकन्स
0 tok

#2 Gemini 3 Flash Preview

medium
खर्च
$0.010
वेळ
17.9s
टोकन्स
3,236 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 6.4 5.8 66.7% 2 7.45s 840 986 1,071
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.88s 494 330 3,216
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 5.7 7.1 44.4% 1 30.10s 8,522 13,057 4,121
Gemini 3 Flash Preview 8.6 7.6 88.9% 1 84.40s 8,122 462 161,084
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 76.66s 20,685 8,178 5,194
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 22.42s 12,873 351 10,485
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 7.37s 8,676 691 757
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.43s 7,548 279 4,893
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 3.0 10.0 0.0% 0 83.40s 674 14,642 8,687
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 15.27s 633 12 21,684
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 5.04s 564 188 292
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.19s 486 72 1,905
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 2.43s 792 266 467
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.04s 615 72 2,709
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 7.7 10.0 66.7% 0 4.71s 816 532 630
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.05s 558 183 4,365
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 9.73s 11,454 861 329
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 12.60s 5,532 234 1,487
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 3.0 10.0 0.0% 0 63.24s 204 8,045 2,452
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.50s 156 11 2,325

झटपट तुलना

तुलना जोडी बदला