नेव्हिगेशन
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Opus 4.7 vs Google: Gemma 4 31B

सारांश

Claude Opus 4.7 vs Gemma 4 31B benchmark तुलना: Claude Opus 4.7 average score मध्ये पुढे आहे: 8.7 vs 6.1. Gemma 4 31B चा benchmark खर्च कमी आहे: $0.004 vs $0.679. Gemma 4 31B वेगवान आहे: 4.05s vs 4.73s, pass rates 82.5% vs 47.6%.

शिफारस केलेले मॉडेल: Claude Opus 4.7 - It has the strongest score in this comparison (8.7) and the best overall balance of cost and response time across all 2 models.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-18

मेट्रिक Claude Opus 4.7 Claude Opus 4.7 medium प्रकाशन: 2026-04-16 Gemma 4 31B Gemma 4 31B none प्रकाशन: 2026-04-02 मोफत उपलब्ध
स्कोअर 8.7 6.1
क्रमांक #13 #98
विश्वसनीयता 10.0 10.0
सुसंगतता 9.6 10.0
बरोबर चाचण्या
प्रति प्रयत्न पास दर 82.5% 47.6%
अस्थिर चाचण्या 1 0
एकूण रन 63 63
प्रति निकाल खर्च 3.991 0.034
एकूण खर्च $0.679 $0.004
इनपुट किंमत $5.000 / 1M $0.120 / 1M
आउटपुट किंमत $25.000 / 1M $0.350 / 1M
एकूण इनपुट टोकन्स 65,406 20,911
आउटपुट टोकन्स 11,858 1,407
रिझनिंग टोकन्स 2,198 0
प्रतिसाद वेळ (सरासरी) 4.73s 4.05s
प्रतिसाद वेळ (कमाल) 23.18s 26.13s
प्रतिसाद वेळ (एकूण) 94.51s 76.87s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#13 Claude Opus 4.7

medium
खर्च
$0.059
वेळ
26.8s
टोकन्स
2,475 tok

#98 Gemma 4 31B

none
खर्च
$0.001
वेळ
12.8s
टोकन्स
795 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 8.3 10.0 75.0% 0 1.85s 894 348 0
Gemma 4 31B 6.5 10.0 50.0% 0 1.85s 852 45 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 7.6 7.2 77.8% 1 12.96s 10,635 7,629 1,114
Gemma 4 31B 5.5 10.0 33.3% 0 11.19s 8,381 735 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 10.0 10.0 100.0% 0 21.45s 24,501 2,369 1,084
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 10.0 10.0 100.0% 0 2.37s 10,533 324 0
Gemma 4 31B 10.0 10.0 100.0% 0 2.25s 8,352 285 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 7.7 10.0 66.7% 0 1.17s 630 51 0
Gemma 4 31B 7.7 10.0 66.7% 0 3.22s 903 27 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 10.0 10.0 100.0% 0 2.87s 723 256 0
Gemma 4 31B 10.0 10.0 100.0% 0 2.09s 576 117 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 10.0 10.0 100.0% 0 1.57s 939 114 0
Gemma 4 31B 6.5 10.0 50.0% 0 2.84s 795 78 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 10.0 10.0 100.0% 0 2.43s 939 370 0
Gemma 4 31B 6.5 10.0 33.3% 0 4.23s 828 108 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 10.0 10.0 100.0% 0 4.17s 15,339 373 0
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 3.0 10.0 0.0% 0 2.25s 273 24 0
Gemma 4 31B 3.0 10.0 0.0% 0 1.25s 224 12 0

झटपट तुलना

तुलना जोडी बदला