#221

Laguna Xs.2

Poolside रिलीज़: 2026-04-28 परीक्षण किया गया: 2026-05-08 15:31 poolside/laguna-xs.2::none

(medium) (none)

सारांश

Laguna Xs.2 AI BENCHY पर 3.8 स्कोर करता है और #221 पर है। इसकी reliability 10.0, pass rate 22.7%, कुल लागत $0.004, और औसत response time 806ms है।

Laguna Xs.2 को अलग क्या बनाता है: इस score range के लिए इसकी कुल benchmark लागत असामान्य रूप से कम है। यह समान मॉडलों की तुलना में काफ़ी तेज है।

संग्रहीत मॉडल: इस मॉडल को अब अपडेट नहीं किया जाएगा और नए परीक्षणों में टेस्ट नहीं किया जाएगा।

स्कोर

3.8

संगति

8.6

विश्वसनीयता

10.0

कुल लागत (वर्तमान कीमत)

$0.004 ↕ New

परीक्षण के समय: $0.000

कुल आउटपुट टोकन

2,826

कुल इनपुट टोकन

33,675

इनपुट कीमत

$0.100 / 1M

आउटपुट कीमत

$0.200 / 1M

सही परीक्षण

गलत टेस्ट: 14

प्रति प्रयास पास दर: 22.7%

अस्थिर टेस्ट

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

806ms

प्रतिक्रिया समय (अधिकतम): 2.01s

प्रतिक्रिया समय (कुल): 12.09s

गलत उत्तर: 8 API त्रुटि: 4 निर्देशों का पालन नहीं किया: 1 अमान्य टूल कॉल: 1

कीमत का इतिहास

OpenRouter से इस मॉडल का ऐतिहासिक मूल्य डेटा।

तारीख	इनपुट कीमत	आउटपुट कीमत
2026-06-04 15:40	$0.000 / 1M	$0.000 / 1M
2026-06-29 01:00	$0.100 / 1M	$0.200 / 1M

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

श्रेणी	स्कोर	संगति
एंटी-एआई ट्रिक्स	3.0	10.0
कोडिंग	8.3	3.3
संयुक्त	1.5	5.0
डेटा पार्सिंग और निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	5.3	10.0
Samanya Buddhimatta	3.0	10.0
निर्देश पालन	6.5	10.0
पहेली समाधान	5.3	10.0
टूल कॉलिंग	3.0	10.0
सामान्य ज्ञान	3.0	10.0

Laguna Xs.2

चार्ट

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

तुलना किए गए मॉडल