नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Google: Gemma 4 31B vs Qwen: Qwen3.5-27B

सारांश

Gemma 4 31B vs Qwen3.5-27B benchmark तुलना: Gemma 4 31B average score में आगे है: 6.3 vs 5.9. Qwen3.5-27B की benchmark लागत कम है: $0.015 vs $0.033. Qwen3.5-27B तेज है: 1.68s vs 56.55s, pass rates 69.8% vs 38.1%.

अनुशंसित मॉडल: Qwen3.5-27B - Its score stays close to the best score here (5.9 vs 6.3), while costing about 2.3x less than Gemma 4 31B.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-12

मेट्रिक Gemma 4 31B Gemma 4 31B medium रिलीज़: 2026-04-02 निःशुल्क उपलब्ध Qwen3.5-27B Qwen3.5-27B none रिलीज़: 2026-02-24
स्कोर 6.3 5.9
रैंक #87 #109
विश्वसनीयता 10.0 10.0
संगति 9.4 9.3
सही परीक्षण
प्रति प्रयास पास दर 69.8% 38.1%
अस्थिर टेस्ट 1 2
कुल रन 63 63
प्रति परिणाम लागत 0.257 0.249
कुल लागत $0.033 $0.015
इनपुट कीमत $0.120 / 1M $0.195 / 1M
आउटपुट कीमत $0.350 / 1M $1.560 / 1M
कुल इनपुट टोकन 17,957 44,478
आउटपुट टोकन 22,356 3,592
रीजनिंग टोकन 65,726 0
प्रतिक्रिया समय (औसत) 56.55s 1.68s
प्रतिक्रिया समय (अधिकतम) 437.40s 9.39s
प्रतिक्रिया समय (कुल) 1074.41s 35.25s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#87 Gemma 4 31B

medium
Cost
$0.002
Time
45.7s
Tokens
2,696 tok

#109 Qwen3.5-27B

none
Cost
$0.007
Time
42.9s
Tokens
4,273 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 10.0 10.0 100.0% 0 12.89s 816 962 2,046
Qwen3.5-27B 4.8 10.0 25.0% 0 788ms 696 267 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 4.3 5.8 22.2% 1 219.76s 5,568 11,098 33,212
Qwen3.5-27B 5.8 10.0 33.3% 0 1.80s 7,913 415 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0 0
Qwen3.5-27B 2.8 1.6 33.3% 1 9.39s 16,918 1,461 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 10.0 10.0 100.0% 0 21.11s 8,334 1,822 2,951
Qwen3.5-27B 10.0 10.0 100.0% 0 1.43s 7,794 243 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 7.7 10.0 66.7% 0 38.48s 876 4,349 8,985
Qwen3.5-27B 3.0 10.0 0.0% 0 540ms 789 15 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 10.0 10.0 100.0% 0 9.57s 567 105 888
Qwen3.5-27B 5.0 10.0 0.0% 0 2.51s 522 126 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 10.0 10.0 100.0% 0 12.76s 777 533 2,035
Qwen3.5-27B 6.3 10.0 50.0% 0 1.03s 711 69 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 9.9 10.0 100.0% 0 26.91s 801 1,795 5,595
Qwen3.5-27B 6.7 7.9 55.6% 1 1.38s 714 683 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0 0
Qwen3.5-27B 10.0 10.0 100.0% 0 3.54s 8,211 303 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 3.0 10.0 0.0% 0 90.14s 218 1,692 10,014
Qwen3.5-27B 3.0 10.0 0.0% 0 599ms 210 10 0

त्वरित तुलना

तुलना जोड़ी बदलें