#100

Owl Alpha

Openrouter रिलीज़: 2026-04-30 परीक्षण किया गया: 2026-05-22 00:43 openrouter/owl-alpha::medium

(medium) (none)

सारांश

Owl Alpha AI BENCHY पर 5.8 स्कोर करता है और #100 पर है। इसकी reliability 9.9, pass rate 41.7%, कुल लागत $0.000, और औसत response time 11.59s है।

Owl Alpha को अलग क्या बनाता है: यह कोडिंग में सबसे अलग दिखता है, जहाँ इसकी रैंक #1 है; जबकि Samanya Buddhimatta इसकी सबसे कमजोर जगह है, जहाँ यह #9 पर है। इस score range के लिए इसकी कुल benchmark लागत असामान्य रूप से कम है।

संग्रहीत मॉडल: इस मॉडल को अब अपडेट नहीं किया जाएगा और नए परीक्षणों में टेस्ट नहीं किया जाएगा।

स्कोर

5.8

संगति

9.6

विश्वसनीयता

9.9

कुल लागत (वर्तमान कीमत)

$0.000

कुल आउटपुट टोकन

2,965

कुल इनपुट टोकन

इनपुट कीमत

$0.000 / 1M

आउटपुट कीमत

$0.000 / 1M

सही परीक्षण

गलत टेस्ट: 12

प्रति प्रयास पास दर: 41.7%

अस्थिर टेस्ट

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

11.59s

प्रतिक्रिया समय (अधिकतम): 58.63s

प्रतिक्रिया समय (कुल): 231.84s

गलत उत्तर: 9 निर्देशों का पालन नहीं किया: 3

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#100 Owl Alpha

medium

Provider returned error

Cost: $0.000
Time: 0.2s
Tokens: 0 tok

रन इतिहास

परीक्षण किया गया	स्कोर	विश्वसनीयता	कुल लागत	तुलना करें
2026-06-04 14:30 नया टेस्ट जोड़ा गया	5.7	10.0	$0.000	तुलना करें
2026-05-22 00:43 सूट बदला गया	5.8	9.9	$0.000	वर्तमान रन
2026-04-30 17:29 पहला रन	5.6	10.0	$0.000	तुलना करें

इस रन में अलग बेंचमार्क सूट इस्तेमाल हुआ था। ऐतिहासिक बदलाव पढ़ते समय सूट बदलाव को ध्यान में रखें।

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

Owl AlphamediumvsGemini 3.5 Flashhigh Owl AlphamediumvsGemini 3 Flash Previewmedium Owl AlphamediumvsNemotron 3 Ultra 550b A55bmediumनिःशुल्क उपलब्ध Owl AlphamediumvsGPT-5.5low

श्रेणी विवरण

श्रेणी	स्कोर	संगति
एंटी-एआई ट्रिक्स	4.8	10.0
कोडिंग	6.6	10.0
संयुक्त	3.0	10.0
डेटा पार्सिंग और निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	5.3	10.0
Samanya Buddhimatta	4.3	10.0
निर्देश पालन	6.3	10.0
पहेली समाधान	5.3	7.2
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

Owl Alpha

Hamster playing table tennis

#100 Owl Alpha

चार्ट

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

तुलना किए गए मॉडल