नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Google: Gemini 2.5 Flash vs Owl Alpha

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-30

मेट्रिक Gemini 2.5 Flash Gemini 2.5 Flash none रिलीज़: 2025-06-17 Owl Alpha Owl Alpha none रिलीज़: 2026-04-30
स्कोर 6.3 6.0
रैंक #76 #87
विश्वसनीयता लागू नहीं 10.0
संगति 9.5 9.1
सही परीक्षण
प्रति प्रयास पास दर 48.2% 46.3%
अस्थिर टेस्ट 1 2
कुल रन 54 54
प्रति परिणाम लागत 0.161 0.000
कुल लागत $0.013 $0.000
???? ??? $0.300 / 1M $0.000 / 1M
????? ??? $2.500 / 1M $0.000 / 1M
आउटपुट टोकन 1,726 1,671
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 903ms 7.07s
प्रतिक्रिया समय (अधिकतम) 4.39s 32.27s
प्रतिक्रिया समय (कुल) 16.26s 127.23s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 3.0 10.0 0.0% 0 582ms 102 0
Owl Alpha 3.4 7.9 16.7% 1 2.78s 57 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 10.0 10.0 100.0% 0 1.16s 453 0
Owl Alpha 10.0 10.0 100.0% 0 32.27s 450 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 3.0 10.0 0.0% 0 4.39s 366 0
Owl Alpha 3.0 10.0 0.0% 0 21.74s 315 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 10.0 10.0 100.0% 0 652ms 279 0
Owl Alpha 10.0 10.0 100.0% 0 3.60s 246 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 5.9 7.2 55.6% 1 495ms 12 0
Owl Alpha 5.3 10.0 33.3% 0 3.00s 27 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 5.0 10.0 0.0% 0 615ms 78 0
Owl Alpha 4.3 10.0 0.0% 0 4.61s 80 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 9.8 10.0 100.0% 0 672ms 70 0
Owl Alpha 6.4 10.0 50.0% 0 2.63s 63 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 5.7 10.0 33.3% 0 576ms 132 0
Owl Alpha 5.9 7.2 55.6% 1 4.43s 202 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 10.0 10.0 100.0% 0 1.91s 234 0
Owl Alpha 10.0 10.0 100.0% 0 22.78s 231 0

त्वरित तुलना

तुलना जोड़ी बदलें