नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Google: Gemma 4 31B vs Qwen: Qwen3.5 Plus 2026-02-15

सारांश

Gemma 4 31B vs Qwen3.5 Plus 2026-02-15 benchmark तुलना: Gemma 4 31B average score में आगे है: 6.3 vs 5.8. Qwen3.5 Plus 2026-02-15 की benchmark लागत कम है: $0.016 vs $0.033. Qwen3.5 Plus 2026-02-15 तेज है: 2.31s vs 56.55s, pass rates 69.8% vs 46.0%.

अनुशंसित मॉडल: Qwen3.5 Plus 2026-02-15 - Its score stays close to the best score here (5.8 vs 6.3), while costing about 2.1x less than Gemma 4 31B.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-07-02

मेट्रिक Gemma 4 31B Gemma 4 31B medium रिलीज़: 2026-04-02 निःशुल्क उपलब्ध Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 none रिलीज़: 2026-02-15
स्कोर 6.3 5.8
रैंक #91 #109
विश्वसनीयता 10.0 10.0
संगति 9.4 9.4
सही परीक्षण
प्रति प्रयास पास दर 69.8% 46.0%
अस्थिर टेस्ट 1 2
कुल रन 63 63
प्रति परिणाम लागत 0.257 0.204
कुल लागत $0.033 $0.016
इनपुट कीमत $0.120 / 1M $0.260 / 1M
आउटपुट कीमत $0.350 / 1M $1.560 / 1M
कुल इनपुट टोकन 17,957 45,864
आउटपुट टोकन 22,356 2,480
रीजनिंग टोकन 65,726 0
प्रतिक्रिया समय (औसत) 56.55s 2.31s
प्रतिक्रिया समय (अधिकतम) 437.40s 6.65s
प्रतिक्रिया समय (कुल) 1074.41s 34.63s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#91 Gemma 4 31B

medium
लागत
$0.002
समय
45.7s
टोकन
2,696 tok

#109 Qwen3.5 Plus 2026-02-15

none
लागत
$0.012
समय
153.2s
टोकन
7,787 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 10.0 10.0 100.0% 0 12.89s 816 962 2,046
Qwen3.5 Plus 2026-02-15 4.8 10.0 25.0% 0 1.91s 696 517 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 4.3 5.8 22.2% 1 219.76s 5,568 11,098 33,212
Qwen3.5 Plus 2026-02-15 4.3 7.9 11.1% 1 2.05s 7,913 473 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0 0
Qwen3.5 Plus 2026-02-15 3.0 10.0 0.0% 0 6.65s 18,304 314 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 10.0 10.0 100.0% 0 21.11s 8,334 1,822 2,951
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 1.89s 7,794 243 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 7.7 10.0 66.7% 0 38.48s 876 4,349 8,985
Qwen3.5 Plus 2026-02-15 5.3 10.0 33.3% 0 1.17s 789 17 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 10.0 10.0 100.0% 0 9.57s 567 105 888
Qwen3.5 Plus 2026-02-15 4.4 3.0 33.3% 1 2.26s 522 117 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 10.0 10.0 100.0% 0 12.76s 777 533 2,035
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 1.67s 711 72 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 9.9 10.0 100.0% 0 26.91s 801 1,795 5,595
Qwen3.5 Plus 2026-02-15 7.7 10.0 66.7% 0 2.71s 714 494 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0 0
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 3.33s 8,211 222 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 3.0 10.0 0.0% 0 90.14s 218 1,692 10,014
Qwen3.5 Plus 2026-02-15 3.0 10.0 0.0% 0 1.11s 210 11 0

त्वरित तुलना

तुलना जोड़ी बदलें