नेव्हिगेशन
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Opus 4.8 vs Google: Gemini 3 Flash Preview

सारांश

Claude Opus 4.8 vs Gemini 3 Flash Preview benchmark तुलना: Gemini 3 Flash Preview average score मध्ये पुढे आहे: 9.6 vs 7.7. Gemini 3 Flash Preview चा benchmark खर्च कमी आहे: $0.667 vs $1.270. Claude Opus 4.8 वेगवान आहे: 10.83s vs 18.64s, pass rates 79.4% vs 98.4%.

शिफारस केलेले मॉडेल: Gemini 3 Flash Preview - It has the best score here (9.6), while costing about 1.9x less than Claude Opus 4.8.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-30

मेट्रिक Claude Opus 4.8 Claude Opus 4.8 low प्रकाशन: 2026-05-28 Gemini 3 Flash Preview Gemini 3 Flash Preview medium प्रकाशन: 2025-12-17
स्कोअर 7.7 9.6
क्रमांक #38 #2
विश्वसनीयता 10.0 10.0
सुसंगतता 8.8 9.7
बरोबर चाचण्या
प्रति प्रयत्न पास दर 79.4% 98.4%
अस्थिर चाचण्या 3 1
एकूण रन 63 63
प्रति निकाल खर्च 8.466 3.335
एकूण खर्च $1.270 $0.667
इनपुट किंमत $5.000 / 1M $0.500 / 1M
आउटपुट किंमत $25.000 / 1M $3.000 / 1M
एकूण इनपुट टोकन्स 60,946 37,017
आउटपुट टोकन्स 31,771 2,006
रिझनिंग टोकन्स 6,831 214,153
प्रतिसाद वेळ (सरासरी) 10.83s 18.64s
प्रतिसाद वेळ (कमाल) 127.97s 117.26s
प्रतिसाद वेळ (एकूण) 227.39s 391.35s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#38 Claude Opus 4.8

low
खर्च
$0.031
वेळ
14.1s
टोकन्स
1,345 tok

#2 Gemini 3 Flash Preview

medium
खर्च
$0.010
वेळ
17.9s
टोकन्स
3,236 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 3.30s 834 793 371
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.88s 494 330 3,216
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 6.6 4.6 77.8% 2 7.58s 10,590 3,637 809
Gemini 3 Flash Preview 8.6 7.6 88.9% 1 84.40s 8,122 462 161,084
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 9.8 10.0 100.0% 0 20.84s 23,500 2,216 1,081
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 22.42s 12,873 351 10,485
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 6.3 5.8 66.7% 1 2.27s 10,503 310 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.43s 7,548 279 4,893
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 5.3 10.0 33.3% 0 45.53s 975 23,311 3,908
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 15.27s 633 12 21,684
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 2.55s 708 231 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.19s 486 72 1,905
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 9.8 10.0 100.0% 0 2.78s 909 111 221
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.04s 615 72 2,709
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 3.01s 894 592 184
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.05s 558 183 4,365
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 6.85s 11,775 370 35
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 12.60s 5,532 234 1,487
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 3.0 10.0 0.0% 0 5.48s 258 200 222
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.50s 156 11 2,325

झटपट तुलना

तुलना जोडी बदला