AI BENCHY
Advertise here
#112

Owl Alpha

Openrouter प्रकाशन: 2026-04-30 चाचणी तारीख: 2026-06-04 14:30 openrouter/owl-alpha::medium
(medium) (none)

सारांश

Owl Alpha AI BENCHY वर 5.8 स्कोर करते आणि #112 वर आहे. याची reliability 10.0, pass rate 39.7%, एकूण खर्च $0.000, आणि सरासरी response time 11.95s आहे.

Owl Alpha खास का आहे: या score range साठी एकूण benchmark खर्च असामान्यपणे कमी आहे.

संग्रहित मॉडेल: हे मॉडेल आता अपडेट केले जाणार नाही आणि नवीन चाचण्यांवर तपासले जाणार नाही.

सुसंगतता

9.6

एकूण आउटपुट टोकन्स

2,974

एकूण इनपुट टोकन्स

43,478

इनपुट किंमत

$0.000 / 1M

आउटपुट किंमत

$0.000 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 13

प्रति प्रयत्न पास दर: 39.7%

अस्थिर चाचण्या

1

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

11.95s

प्रतिसाद वेळ (कमाल): 58.63s

प्रतिसाद वेळ (एकूण): 250.88s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#112 Owl Alpha

medium
Provider returned error
Cost
$0.000
Time
0.2s
Tokens
0 tok

रन इतिहास

चाचणी तारीख स्कोअर विश्वसनीयता बरोबर चाचण्या एकूण खर्च तुलना करा
2026-06-04 14:30 नवीन चाचणी जोडली 5.7 10.0 $0.000 सध्याची रन
2026-05-22 00:43 सूट बदलला 5.8 9.9 $0.000 तुलना करा
2026-04-30 17:29 पहिला रन 5.6 10.0 $0.000 तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

रन तुलना

रनस्कोअरसुसंगतताविश्वसनीयताबरोबर चाचण्याअस्थिर चाचण्याएकूण आउटपुट टोकन्सएकूण इनपुट टोकन्सएकूण खर्चप्रतिसाद वेळ (सरासरी)
2026-06-04 14:30 · सध्याची रन5.89.610.08/2112,97443,478$0.00011.95s
2026-05-22 00:43 · सूट बदलला5.89.69.98/2012,9650$0.00011.59s
फरक0.00.0+0.100+9+43478$0.000+355ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख इनपुट किंमत आउटपुट किंमत
2026-06-04 15:40 $0.000 / 1M $0.000 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

श्रेणी स्कोअर सुसंगतता बरोबर चाचण्या
अँटी-एआय युक्त्या 4.8 10.0
कोडिंग 5.4 10.0
संयुक्त 3.0 10.0
डेटा पार्सिंग आणि निष्कर्षण 10.0 10.0
डोमेन-विशिष्ट 5.3 10.0
Samanya Buddhimatta 4.3 10.0
सूचनांचे पालन 6.5 10.0
कोडी सोडवणे 5.3 7.2
टूल कॉलिंग 10.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना केलेली मॉडेल्स