नेविगेशन
AI BENCHY
तुलना करें चार्ट Karyapranali
❤️ Made by XCS
Your ad here

AI BENCHY तुलना

Google: Gemini 3.1 Flash Lite Preview vs Qwen: Qwen3.5-Flash

तुलना करें:

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-06

मेट्रिक Google: Gemini 3.1 Flash Lite Preview low रिलीज़: 2026-03-03 Qwen: Qwen3.5-Flash medium रिलीज़: 2026-02-24
औसत स्कोर 7.6 7.0
रैंक #12 #24
सही परीक्षण
संगति 10.0 7.8
प्रति परिणाम लागत 0.170 0.565
कुल लागत $0.019 $0.057
प्रति प्रयास पास दर 73.3% 82.2%
अस्थिर टेस्ट 0 4
common.totalRuns 45 (15 x 3) 45 (15 x 3)
आउटपुट टोकन 1,542 1,708
रीजनिंग टोकन 6,888 131,466
प्रतिक्रिया समय (औसत) 3.49s 72.86s
प्रतिक्रिया समय (अधिकतम) 11.91s 234.29s
प्रतिक्रिया समय (कुल) 52.29s 1092.84s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

औसत स्कोर vs प्रतिक्रिया समय (औसत)

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Google: Gemini 3.1 Flash Lite Preview 7.0 10.0 66.7% 0 2.18s 456 1,224
Qwen: Qwen3.5-Flash 10.0 10.0 100.0% 0 71.35s 363 23,645
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Google: Gemini 3.1 Flash Lite Preview 10.0 10.0 0.0% 0 11.91s 225 762
Qwen: Qwen3.5-Flash 10.0 10.0 100.0% 0 17.78s 483 8,270
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Google: Gemini 3.1 Flash Lite Preview 9.9 10.0 100.0% 0 3.00s 291 696
Qwen: Qwen3.5-Flash 5.5 5.9 83.3% 1 56.99s 235 16,237
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Google: Gemini 3.1 Flash Lite Preview 4.0 10.0 33.3% 0 2.36s 18 1,212
Qwen: Qwen3.5-Flash 4.0 7.2 44.4% 1 146.50s 58 43,615
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Google: Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.49s 72 753
Qwen: Qwen3.5-Flash 10.0 10.0 100.0% 0 63.49s 98 14,139
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Google: Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 2.76s 243 1,248
Qwen: Qwen3.5-Flash 4.0 4.4 77.8% 2 56.74s 162 24,276
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Google: Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 9.54s 237 993
Qwen: Qwen3.5-Flash 10.0 10.0 100.0% 0 10.33s 309 1,284

त्वरित तुलना

तुलना जोड़ी बदलें