नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Google: Gemma 4 31B vs Qwen: Qwen3.5-122B-A10B

सारांश

Gemma 4 31B vs Qwen3.5-122B-A10B benchmark तुलना: Gemma 4 31B average score में आगे है: 6.3 vs 5.3. Qwen3.5-122B-A10B की benchmark लागत कम है: $0.020 vs $0.033. Qwen3.5-122B-A10B तेज है: 3.41s vs 56.55s, pass rates 69.8% vs 31.8%.

अनुशंसित मॉडल: Qwen3.5-122B-A10B - It offers the best overall trade-off: a competitive score (5.3), lower cost than Gemma 4 31B, and balanced response time.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक Gemma 4 31B Gemma 4 31B medium रिलीज़: 2026-04-02 निःशुल्क उपलब्ध Qwen3.5-122B-A10B Qwen3.5-122B-A10B none रिलीज़: 2026-02-24
स्कोर 6.3 5.3
रैंक #88 #125
विश्वसनीयता 10.0 10.0
संगति 9.4 9.6
सही परीक्षण
प्रति प्रयास पास दर 69.8% 31.8%
अस्थिर टेस्ट 1 1
कुल रन 63 63
प्रति परिणाम लागत 0.257 0.393
कुल लागत $0.033 $0.020
इनपुट कीमत $0.120 / 1M $0.260 / 1M
आउटपुट कीमत $0.350 / 1M $2.080 / 1M
कुल इनपुट टोकन 17,957 47,735
आउटपुट टोकन 22,356 3,383
रीजनिंग टोकन 65,726 0
प्रतिक्रिया समय (औसत) 56.55s 3.41s
प्रतिक्रिया समय (अधिकतम) 437.40s 46.00s
प्रतिक्रिया समय (कुल) 1074.41s 71.59s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#88 Gemma 4 31B

medium
लागत
$0.002
समय
45.7s
टोकन
2,696 tok

#125 Qwen3.5-122B-A10B

none
लागत
$0.016
समय
44.5s
टोकन
6,431 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 10.0 10.0 100.0% 0 12.89s 816 962 2,046
Qwen3.5-122B-A10B 4.8 10.0 25.0% 0 1.59s 696 312 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 4.3 5.8 22.2% 1 219.76s 5,568 11,098 33,212
Qwen3.5-122B-A10B 3.7 7.0 22.2% 1 2.77s 7,913 693 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0 0
Qwen3.5-122B-A10B 3.0 10.0 0.0% 0 46.00s 20,175 1,137 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 10.0 10.0 100.0% 0 21.11s 8,334 1,822 2,951
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 1.01s 7,794 243 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 7.7 10.0 66.7% 0 38.48s 876 4,349 8,985
Qwen3.5-122B-A10B 5.3 10.0 33.3% 0 465ms 789 15 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 10.0 10.0 100.0% 0 9.57s 567 105 888
Qwen3.5-122B-A10B 5.0 10.0 0.0% 0 1.12s 522 66 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 10.0 10.0 100.0% 0 12.76s 777 533 2,035
Qwen3.5-122B-A10B 6.3 10.0 50.0% 0 513ms 711 69 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 9.9 10.0 100.0% 0 26.91s 801 1,795 5,595
Qwen3.5-122B-A10B 3.8 10.0 0.0% 0 1.00s 714 575 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0 0
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 2.04s 8,211 264 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 3.0 10.0 0.0% 0 90.14s 218 1,692 10,014
Qwen3.5-122B-A10B 3.0 10.0 0.0% 0 295ms 210 9 0

त्वरित तुलना

तुलना जोड़ी बदलें