#180

Elephant Alpha

Openrouter रिलीज़: 2026-04-14 परीक्षण किया गया: 2026-06-04 14:27 openrouter/elephant-alpha::none

(medium) (none)

सारांश

Elephant Alpha AI BENCHY पर 4.6 स्कोर करता है और #180 पर है। इसकी reliability लागू नहीं, pass rate 27.0%, कुल लागत $0.000, और औसत response time 1.22s है।

Elephant Alpha को अलग क्या बनाता है: यह निर्देश पालन में सबसे अलग दिखता है, जहाँ इसकी रैंक #1 है; जबकि टूल कॉलिंग इसकी सबसे कमजोर जगह है, जहाँ यह #7 पर है। इस score range के लिए इसकी कुल benchmark लागत असामान्य रूप से कम है।

संग्रहीत मॉडल: इस मॉडल को अब अपडेट नहीं किया जाएगा और नए परीक्षणों में टेस्ट नहीं किया जाएगा।

स्कोर

4.6

संगति

9.7

विश्वसनीयता

लागू नहीं

कुल लागत (वर्तमान कीमत)

$0.000

कुल आउटपुट टोकन

2,573

कुल इनपुट टोकन

33,743

इनपुट कीमत

$0.000 / 1M

आउटपुट कीमत

$0.000 / 1M

सही परीक्षण

गलत टेस्ट: 16

प्रति प्रयास पास दर: 27.0%

अस्थिर टेस्ट

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

1.22s

प्रतिक्रिया समय (अधिकतम): 3.81s

प्रतिक्रिया समय (कुल): 22.03s

गलत उत्तर: 9 API त्रुटि: 3 निर्देशों का पालन नहीं किया: 3 अमान्य टूल कॉल: 1

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#180 Elephant Alpha

none

Elephant Alpha was a stealth model revealed on April 21st as Ling-2.6-flash. Find it here: https://openrouter.ai/inclusionai/ling-2.6-flash:free

लागत: $0.000
समय: 0.1s
टोकन: 0 tok

रन इतिहास

परीक्षण किया गया	स्कोर	विश्वसनीयता	कुल लागत	तुलना करें
2026-06-04 14:27 नया टेस्ट जोड़ा गया	5.1	लागू नहीं	$0.000	वर्तमान रन
2026-05-22 00:40 सूट बदला गया	5.2	लागू नहीं	$0.000	तुलना करें
2026-04-22 12:55 पहला दर्ज रन	5.2	लागू नहीं	$0.000	तुलना करें

इस रन में अलग बेंचमार्क सूट इस्तेमाल हुआ था। ऐतिहासिक बदलाव पढ़ते समय सूट बदलाव को ध्यान में रखें।

रन तुलना

रन	स्कोर	संगति	विश्वसनीयता	सही परीक्षण	अस्थिर टेस्ट	कुल आउटपुट टोकन	कुल इनपुट टोकन	कुल लागत	प्रतिक्रिया समय (औसत)
2026-06-04 14:27 · वर्तमान रन	4.6	9.7	लागू नहीं	5/21	1	2,573	33,743	$0.000	1.22s
2026-04-22 12:55 · पहला दर्ज रन	5.2	9.6	लागू नहीं	5/18	1	2,573	0	$0.000	1.23s
अंतर	-0.6	+0.1		0	0	0	+33743	$0.000	-7ms

इन दो रन में अलग-अलग बेंचमार्क सूट इस्तेमाल हुए थे, इसलिए अंतर मॉडल बदलाव और सूट बदलाव दोनों को दर्शाते हैं।

कीमत का इतिहास

OpenRouter से इस मॉडल का ऐतिहासिक मूल्य डेटा।

तारीख	इनपुट कीमत	आउटपुट कीमत
2026-06-04 15:40	$0.000 / 1M	$0.000 / 1M

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

Elephant AlphanonevsGemini 3.5 Flashhigh Elephant AlphanonevsGemini 3 Flash Previewmedium Elephant AlphanonevsNemotron 3 Ultra 550b A55bmediumनिःशुल्क उपलब्ध Elephant AlphanonevsGPT-5.5low

श्रेणी विवरण

श्रेणी	स्कोर	संगति
एंटी-एआई ट्रिक्स	6.6	10.0
कोडिंग	4.2	7.8
संयुक्त	3.0	10.0
डेटा पार्सिंग और निष्कर्षण	6.5	10.0
डोमेन-विशिष्ट	3.0	10.0
Samanya Buddhimatta	4.0	10.0
निर्देश पालन	9.8	10.0
पहेली समाधान	4.2	10.0
टूल कॉलिंग	3.0	10.0
सामान्य ज्ञान	3.0	10.0

Elephant Alpha

Hamster playing table tennis

#180 Elephant Alpha

चार्ट

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

तुलना किए गए मॉडल