नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Google: Gemini 3.1 Flash Lite vs Owl Alpha

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-08

मेट्रिक Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite none रिलीज़: 2026-05-08 Owl Alpha Owl Alpha medium रिलीज़: 2026-04-30
स्कोर 6.7 6.0
रैंक #73 #88
विश्वसनीयता 10.0 10.0
संगति 8.4 9.6
सही परीक्षण
प्रति प्रयास पास दर 57.9% 43.9%
अस्थिर टेस्ट 4 1
कुल रन 57 57
प्रति परिणाम लागत 0.123 0.000
कुल लागत $0.012 $0.000
???? ??? $0.250 / 1M $0.000 / 1M
????? ??? $1.500 / 1M $0.000 / 1M
आउटपुट टोकन 2,454 1,613
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 1.11s 10.58s
प्रतिक्रिया समय (अधिकतम) 2.97s 58.63s
प्रतिक्रिया समय (कुल) 21.13s 201.03s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 7.5 8.4 66.7% 1 1.07s 639 0
Owl Alpha 4.8 10.0 25.0% 0 3.97s 87 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.59s 636 0
Owl Alpha 10.0 10.0 100.0% 0 7.35s 402 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 2.73s 357 0
Owl Alpha 3.0 10.0 0.0% 0 10.01s 315 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 843ms 279 0
Owl Alpha 10.0 10.0 100.0% 0 21.64s 246 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 2.9 7.2 11.1% 1 762ms 15 0
Owl Alpha 5.3 10.0 33.3% 0 8.58s 28 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 4.0 10.0 0.0% 0 992ms 63 0
Owl Alpha 4.3 10.0 0.0% 0 58.63s 98 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 859ms 72 0
Owl Alpha 6.3 10.0 50.0% 0 9.59s 57 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 6.3 4.8 66.7% 2 720ms 150 0
Owl Alpha 5.3 7.2 44.4% 1 3.44s 135 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 2.97s 234 0
Owl Alpha 10.0 10.0 100.0% 0 8.26s 228 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 733ms 9 0
Owl Alpha 3.0 10.0 0.0% 0 2.38s 17 0

त्वरित तुलना

तुलना जोड़ी बदलें