नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Google: Gemini 2.5 Flash vs Qwen: Qwen3.5-Flash

सारांश

Gemini 2.5 Flash vs Qwen3.5-Flash benchmark तुलना: Qwen3.5-Flash average score में आगे है: 6.8 vs 6.2. Gemini 2.5 Flash की benchmark लागत कम है: $0.016 vs $0.080. Gemini 2.5 Flash तेज है: 875ms vs 63.29s, pass rates 46.0% vs 71.4%.

अनुशंसित मॉडल: Gemini 2.5 Flash - Its score stays close to the best score here (6.2 vs 6.8), while costing about 5.2x less than Qwen3.5-Flash.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक Gemini 2.5 Flash Gemini 2.5 Flash none रिलीज़: 2025-06-17 Qwen3.5-Flash Qwen3.5-Flash medium रिलीज़: 2026-02-24
स्कोर 6.2 6.8
रैंक #93 #70
विश्वसनीयता 10.0 10.0
संगति 9.6 8.1
सही परीक्षण
प्रति प्रयास पास दर 46.0% 71.4%
अस्थिर टेस्ट 1 5
कुल रन 63 63
प्रति परिणाम लागत 0.169 0.871
कुल लागत $0.016 $0.080
इनपुट कीमत $0.300 / 1M $0.065 / 1M
आउटपुट कीमत $2.500 / 1M $0.260 / 1M
कुल इनपुट टोकन 35,926 38,926
आउटपुट टोकन 1,770 2,088
रीजनिंग टोकन 0 294,598
प्रतिक्रिया समय (औसत) 875ms 63.29s
प्रतिक्रिया समय (अधिकतम) 4.39s 234.29s
प्रतिक्रिया समय (कुल) 18.37s 1265.85s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#93 Gemini 2.5 Flash

none
अमान्य SVG
लागत
$0.164
समय
215.5s
टोकन
65,659 tok

#70 Qwen3.5-Flash

medium
लागत
$0.002
समय
25.8s
टोकन
4,294 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 3.0 10.0 0.0% 0 582ms 492 102 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 59.11s 672 383 32,992
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 5.5 10.0 33.3% 0 736ms 8,122 483 0
Qwen3.5-Flash 3.7 7.2 22.2% 1 58.87s 6,685 302 90,081
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 3.0 10.0 0.0% 0 4.39s 12,519 366 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 17.78s 14,934 483 8,270
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 10.0 10.0 100.0% 0 652ms 7,257 279 0
Qwen3.5-Flash 7.3 5.9 83.3% 1 56.99s 6,061 235 16,237
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 5.9 7.2 55.6% 1 495ms 633 12 0
Qwen3.5-Flash 5.3 7.2 44.4% 1 146.50s 581 58 43,615
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 5.0 10.0 0.0% 0 615ms 486 78 0
Qwen3.5-Flash 6.1 3.1 66.7% 1 40.05s 516 99 38,486
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 10.0 10.0 100.0% 0 590ms 615 72 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 63.49s 699 98 14,139
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 7.7 10.0 66.7% 0 604ms 558 132 0
Qwen3.5-Flash 8.2 7.2 88.9% 1 27.61s 381 89 12,457
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 10.0 10.0 100.0% 0 1.91s 5,088 234 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 10.33s 8,193 309 1,284
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 3.0 10.0 0.0% 0 1.15s 156 12 0
Qwen3.5-Flash 3.0 10.0 0.0% 0 48.98s 204 32 37,037

त्वरित तुलना

तुलना जोड़ी बदलें