नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

तुलना किए गए मॉडल

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-02

मेट्रिक Gemma 4 31B Gemma 4 31B medium रिलीज़: 2026-04-02 Gemini 3 Flash Preview Gemini 3 Flash Preview medium रिलीज़: 2025-12-17 Gemini 3 PRO Preview Gemini 3 PRO Preview medium रिलीज़: 2025-11-18 Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium रिलीज़: 2026-02-19
स्कोर 8.6 10.0 8.7 9.6
रैंक #5 #1 #4 #2
संगति 9.6 10.0 10.0 10.0
सही परीक्षण
प्रति प्रयास पास दर 80.4% 100.0% 82.4% 94.1%
अस्थिर टेस्ट 1 0 0 0
कुल रन 51 51 51 51
प्रति परिणाम लागत 0.109 0.972 1.406 3.257
कुल लागत $0.015 $0.166 $0.197 $0.522
???? ??? $0.140 / 1M $0.500 / 1M $0.000 / 1M $2.000 / 1M
????? ??? $0.400 / 1M $3.000 / 1M $0.000 / 1M $12.000 / 1M
आउटपुट टोकन 9,568 1,640 1,508 1,527
रीजनिंग टोकन 22,501 48,270 10,084 36,341
प्रतिक्रिया समय (औसत) 21.81s 11.39s 9.06s 15.56s
प्रतिक्रिया समय (अधिकतम) 68.92s 50.16s 26.24s 40.61s
प्रतिक्रिया समय (कुल) 327.16s 113.86s 90.58s 155.64s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 10.0 10.0 100.0% 0 12.89s 962 2,046
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.13s 305 3,490
Gemini 3 PRO Preview 10.0 10.0 100.0% 0 14.99s 149 1,485
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.90s 112 3,218
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 50.16s 351 12,645
Gemini 3 PRO Preview 3.0 10.0 0.0% 0 10.37s 351 952
Gemini 3.1 Pro Preview 9.5 10.0 100.0% 0 40.61s 432 9,281
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 10.0 10.0 100.0% 0 21.11s 1,822 2,951
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.72s 279 5,333
Gemini 3 PRO Preview 10.0 10.0 100.0% 0 10.84s 279 3,156
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.72s 279 3,904
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 7.7 10.0 66.7% 0 38.48s 4,349 8,985
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 21.12s 12 14,908
Gemini 3 PRO Preview 5.3 10.0 33.3% 0 7.01s 15 1,195
Gemini 3.1 Pro Preview 7.7 10.0 66.7% 0 32.73s 18 12,424
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 10.0 10.0 100.0% 0 9.57s 105 888
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.09s 111 1,285
Gemini 3 PRO Preview 10.0 10.0 100.0% 0 9.34s 78 374
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 11.77s 108 1,179
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 10.0 10.0 100.0% 0 12.76s 533 2,035
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 6.10s 72 4,558
Gemini 3 PRO Preview 9.8 10.0 100.0% 0 3.26s 69 754
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 9.56s 72 2,236
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 8.8 7.9 88.9% 1 27.63s 1,797 5,596
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.43s 276 4,921
Gemini 3 PRO Preview 10.0 10.0 100.0% 0 3.91s 243 1,197
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.15s 232 3,117
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 10.55s 234 1,130
Gemini 3 PRO Preview 10.0 10.0 100.0% 0 11.96s 324 971
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 23.15s 274 982

त्वरित तुलना

तुलना जोड़ी बदलें