नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

inclusionAI: Ling-2.6-flash vs Owl Alpha

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-22

मेट्रिक Ling-2.6-flash Ling-2.6-flash none रिलीज़: 2026-04-21 Owl Alpha Owl Alpha none रिलीज़: 2026-04-30
स्कोर 5.3 5.7
रैंक #128 #106
विश्वसनीयता 10.0 10.0
संगति 9.2 9.2
सही परीक्षण
प्रति प्रयास पास दर 35.1% 41.7%
अस्थिर टेस्ट 2 2
कुल रन 60 60
प्रति परिणाम लागत 0.005 0.000
कुल लागत $0.001 $0.000
???? ??? $0.010 / 1M $0.000 / 1M
????? ??? $0.030 / 1M $0.000 / 1M
आउटपुट टोकन 2,878 4,864
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 9.76s 8.84s
प्रतिक्रिया समय (अधिकतम) 35.34s 47.10s
प्रतिक्रिया समय (कुल) 185.37s 176.83s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Ling-2.6-flash 6.8 8.1 58.3% 1 11.81s 573 0
Owl Alpha 3.4 7.9 16.7% 1 2.78s 57 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Ling-2.6-flash 10.0 10.0 100.0% 0 11.21s 381 0
Owl Alpha 7.0 9.9 50.0% 0 39.68s 3,629 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Ling-2.6-flash 3.0 10.0 0.0% 0 35.34s 1,069 0
Owl Alpha 3.0 10.0 0.0% 0 21.74s 315 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Ling-2.6-flash 6.5 10.0 50.0% 0 8.48s 246 0
Owl Alpha 10.0 10.0 100.0% 0 3.60s 246 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Ling-2.6-flash 3.0 10.0 0.0% 0 4.95s 24 0
Owl Alpha 5.3 10.0 33.3% 0 3.00s 27 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Ling-2.6-flash 4.0 10.0 0.0% 0 1.45s 109 0
Owl Alpha 4.3 10.0 0.0% 0 4.61s 80 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Ling-2.6-flash 9.8 10.0 100.0% 0 5.52s 81 0
Owl Alpha 6.4 10.0 50.0% 0 2.63s 63 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Ling-2.6-flash 2.9 7.2 11.1% 1 9.14s 151 0
Owl Alpha 5.9 7.2 55.6% 1 4.43s 202 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Ling-2.6-flash 3.0 10.0 0.0% 0 18.80s 229 0
Owl Alpha 10.0 10.0 100.0% 0 22.78s 231 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Ling-2.6-flash 3.0 10.0 0.0% 0 1.06s 15 0
Owl Alpha 3.0 10.0 0.0% 0 2.50s 14 0

त्वरित तुलना

तुलना जोड़ी बदलें