#112

Owl Alpha

Openrouter रिलीज़: 2026-04-30 परीक्षण किया गया: 2026-06-04 14:30 openrouter/owl-alpha::medium

(medium) (none)

सारांश

Owl Alpha AI BENCHY पर 5.8 स्कोर करता है और #112 पर है। इसकी reliability 10.0, pass rate 39.7%, कुल लागत $0.000, और औसत response time 11.95s है।

Owl Alpha को अलग क्या बनाता है: इस score range के लिए इसकी कुल benchmark लागत असामान्य रूप से कम है।

संग्रहीत मॉडल: इस मॉडल को अब अपडेट नहीं किया जाएगा और नए परीक्षणों में टेस्ट नहीं किया जाएगा।

स्कोर

5.8

संगति

9.6

विश्वसनीयता

10.0

कुल लागत (वर्तमान कीमत)

$0.000

कुल आउटपुट टोकन

2,974

कुल इनपुट टोकन

43,478

इनपुट कीमत

$0.000 / 1M

आउटपुट कीमत

$0.000 / 1M

सही परीक्षण

गलत टेस्ट: 13

प्रति प्रयास पास दर: 39.7%

अस्थिर टेस्ट

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

11.95s

प्रतिक्रिया समय (अधिकतम): 58.63s

प्रतिक्रिया समय (कुल): 250.88s

गलत उत्तर: 10 निर्देशों का पालन नहीं किया: 2 API त्रुटि: 1

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#112 Owl Alpha

medium

Provider returned error

Cost: $0.000
Time: 0.2s
Tokens: 0 tok

रन इतिहास

परीक्षण किया गया	स्कोर	विश्वसनीयता	कुल लागत	तुलना करें
2026-06-04 14:30 नया टेस्ट जोड़ा गया	5.7	10.0	$0.000	वर्तमान रन
2026-05-22 00:43 सूट बदला गया	5.8	9.9	$0.000	तुलना करें
2026-04-30 17:29 पहला रन	5.6	10.0	$0.000	तुलना करें

इस रन में अलग बेंचमार्क सूट इस्तेमाल हुआ था। ऐतिहासिक बदलाव पढ़ते समय सूट बदलाव को ध्यान में रखें।

रन तुलना

रन	स्कोर	संगति	विश्वसनीयता	सही परीक्षण	अस्थिर टेस्ट	कुल आउटपुट टोकन	कुल इनपुट टोकन	कुल लागत	प्रतिक्रिया समय (औसत)
2026-06-04 14:30 · वर्तमान रन	5.8	9.6	10.0	8/21	1	2,974	43,478	$0.000	11.95s
2026-04-30 17:29 · पहला रन	5.6	9.2	10.0	6/18	2	1,596	0	$0.000	11.04s
अंतर	+0.2	+0.4	0.0	+2	-1	+1378	+43478	$0.000	+911ms

इन दो रन में अलग-अलग बेंचमार्क सूट इस्तेमाल हुए थे, इसलिए अंतर मॉडल बदलाव और सूट बदलाव दोनों को दर्शाते हैं।

कीमत का इतिहास

OpenRouter से इस मॉडल का ऐतिहासिक मूल्य डेटा।

तारीख	इनपुट कीमत	आउटपुट कीमत
2026-06-04 15:40	$0.000 / 1M	$0.000 / 1M

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

Owl AlphamediumvsGemini 3.5 Flashhigh Owl AlphamediumvsGemini 3 Flash Previewmedium Owl AlphamediumvsNemotron 3 Ultra 550b A55bmediumनिःशुल्क उपलब्ध Owl AlphamediumvsGPT-5.5low

श्रेणी विवरण

श्रेणी	स्कोर	संगति
एंटी-एआई ट्रिक्स	4.8	10.0
कोडिंग	5.4	10.0
संयुक्त	3.0	10.0
डेटा पार्सिंग और निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	5.3	10.0
Samanya Buddhimatta	4.3	10.0
निर्देश पालन	6.5	10.0
पहेली समाधान	5.3	7.2
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

Owl Alpha

Hamster playing table tennis

#112 Owl Alpha

चार्ट

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

तुलना किए गए मॉडल