नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Google: Gemini 3.1 Flash Lite vs Qwen: Qwen3.5-Flash

सारांश

Gemini 3.1 Flash Lite vs Qwen3.5-Flash benchmark तुलना: Qwen3.5-Flash average score में आगे है: 6.8 vs 6.1. Gemini 3.1 Flash Lite की benchmark लागत कम है: $0.013 vs $0.080. Gemini 3.1 Flash Lite तेज है: 1.06s vs 63.29s, pass rates 52.4% vs 71.4%.

अनुशंसित मॉडल: Gemini 3.1 Flash Lite - Its score stays close to the best score here (6.1 vs 6.8), while costing about 6.2x less than Qwen3.5-Flash.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite none रिलीज़: 2026-05-08 Qwen3.5-Flash Qwen3.5-Flash medium रिलीज़: 2026-02-24
स्कोर 6.1 6.8
रैंक #96 #70
विश्वसनीयता 10.0 10.0
संगति 8.6 8.1
सही परीक्षण
प्रति प्रयास पास दर 52.4% 71.4%
अस्थिर टेस्ट 4 5
कुल रन 63 63
प्रति परिणाम लागत 0.144 0.871
कुल लागत $0.013 $0.080
इनपुट कीमत $0.250 / 1M $0.065 / 1M
आउटपुट कीमत $1.500 / 1M $0.260 / 1M
कुल इनपुट टोकन 36,710 38,926
आउटपुट टोकन 2,484 2,088
रीजनिंग टोकन 0 294,598
प्रतिक्रिया समय (औसत) 1.06s 63.29s
प्रतिक्रिया समय (अधिकतम) 2.97s 234.29s
प्रतिक्रिया समय (कुल) 22.35s 1265.85s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#96 Gemini 3.1 Flash Lite

none
लागत
$0.001
समय
4.5s
टोकन
727 tok

#70 Qwen3.5-Flash

medium
लागत
$0.002
समय
25.8s
टोकन
4,294 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 7.5 8.4 66.7% 1 1.07s 506 639 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 59.11s 672 383 32,992
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 5.5 10.0 33.3% 0 938ms 8,128 666 0
Qwen3.5-Flash 3.7 7.2 22.2% 1 58.87s 6,685 302 90,081
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 2.73s 12,870 357 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 17.78s 14,934 483 8,270
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 843ms 7,267 279 0
Qwen3.5-Flash 7.3 5.9 83.3% 1 56.99s 6,061 235 16,237
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 2.9 7.2 11.1% 1 762ms 647 15 0
Qwen3.5-Flash 5.3 7.2 44.4% 1 146.50s 581 58 43,615
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 4.0 10.0 0.0% 0 992ms 486 63 0
Qwen3.5-Flash 6.1 3.1 66.7% 1 40.05s 516 99 38,486
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 859ms 619 72 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 63.49s 699 98 14,139
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 6.3 4.8 66.7% 2 720ms 570 150 0
Qwen3.5-Flash 8.2 7.2 88.9% 1 27.61s 381 89 12,457
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 2.97s 5,457 234 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 10.33s 8,193 309 1,284
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 733ms 160 9 0
Qwen3.5-Flash 3.0 10.0 0.0% 0 48.98s 204 32 37,037

त्वरित तुलना

तुलना जोड़ी बदलें