नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Google: Gemini 3.1 Pro Preview vs Owl Alpha

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-30

मेट्रिक Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium रिलीज़: 2026-02-19 Owl Alpha Owl Alpha none रिलीज़: 2026-04-30
स्कोर 9.6 6.0
रैंक #2 #87
विश्वसनीयता लागू नहीं 10.0
संगति 10.0 9.1
सही परीक्षण
प्रति प्रयास पास दर 94.4% 46.3%
अस्थिर टेस्ट 0 2
कुल रन 54 54
प्रति परिणाम लागत 3.400 0.000
कुल लागत $0.578 $0.000
???? ??? $2.000 / 1M $0.000 / 1M
????? ??? $12.000 / 1M $0.000 / 1M
आउटपुट टोकन 1,932 1,671
रीजनिंग टोकन 40,542 0
प्रतिक्रिया समय (औसत) 15.96s 7.07s
प्रतिक्रिया समय (अधिकतम) 40.61s 32.27s
प्रतिक्रिया समय (कुल) 175.52s 127.23s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.90s 112 3,218
Owl Alpha 3.4 7.9 16.7% 1 2.78s 57 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 19.88s 405 4,201
Owl Alpha 10.0 10.0 100.0% 0 32.27s 450 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Pro Preview 9.5 10.0 100.0% 0 40.61s 432 9,281
Owl Alpha 3.0 10.0 0.0% 0 21.74s 315 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.72s 279 3,904
Owl Alpha 10.0 10.0 100.0% 0 3.60s 246 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Pro Preview 7.7 10.0 66.7% 0 32.73s 18 12,424
Owl Alpha 5.3 10.0 33.3% 0 3.00s 27 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 11.77s 108 1,179
Owl Alpha 4.3 10.0 0.0% 0 4.61s 80 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 9.56s 72 2,236
Owl Alpha 6.4 10.0 50.0% 0 2.63s 63 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.15s 232 3,117
Owl Alpha 5.9 7.2 55.6% 1 4.43s 202 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 23.15s 274 982
Owl Alpha 10.0 10.0 100.0% 0 22.78s 231 0

त्वरित तुलना

तुलना जोड़ी बदलें