#214

Laguna Xs.2

Poolside रिलीज़: 2026-04-28 परीक्षण किया गया: 2026-05-08 15:31 poolside/laguna-xs.2::medium

(medium) (none)

सारांश

Laguna Xs.2 AI BENCHY पर 4.1 स्कोर करता है और #214 पर है। इसकी reliability 10.0, pass rate 43.9%, कुल लागत $0.015, और औसत response time 6.73s है।

Laguna Xs.2 को अलग क्या बनाता है: इस score range के लिए इसकी कुल benchmark लागत असामान्य रूप से कम है। यह समान मॉडलों की तुलना में काफ़ी तेज है।

संग्रहीत मॉडल: इस मॉडल को अब अपडेट नहीं किया जाएगा और नए परीक्षणों में टेस्ट नहीं किया जाएगा।

स्कोर

4.1

संगति

6.4

विश्वसनीयता

10.0

कुल लागत (वर्तमान कीमत)

$0.015 ↕ New

परीक्षण के समय: $0.000

कुल आउटपुट टोकन

54,218

कुल इनपुट टोकन

39,481

इनपुट कीमत

$0.100 / 1M

आउटपुट कीमत

$0.200 / 1M

सही परीक्षण

गलत टेस्ट: 13

प्रति प्रयास पास दर: 43.9%

अस्थिर टेस्ट

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

6.73s

प्रतिक्रिया समय (अधिकतम): 29.11s

प्रतिक्रिया समय (कुल): 100.98s

गलत उत्तर: 6 API त्रुटि: 4 कोई उत्तर नहीं: 2 अमान्य टूल कॉल: 1

कीमत का इतिहास

OpenRouter से इस मॉडल का ऐतिहासिक मूल्य डेटा।

तारीख	इनपुट कीमत	आउटपुट कीमत
2026-06-04 15:40	$0.000 / 1M	$0.000 / 1M
2026-06-29 01:00	$0.100 / 1M	$0.200 / 1M

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

श्रेणी	स्कोर	संगति
एंटी-एआई ट्रिक्स	6.9	7.9
कोडिंग	2.1	1.2
संयुक्त	1.5	5.0
डेटा पार्सिंग और निष्कर्षण	7.1	5.6
डोमेन-विशिष्ट	4.1	4.4
Samanya Buddhimatta	3.0	10.0
निर्देश पालन	10.0	10.0
पहेली समाधान	5.3	10.0
टूल कॉलिंग	4.7	1.6
सामान्य ज्ञान	3.0	10.0

Laguna Xs.2

चार्ट

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

तुलना किए गए मॉडल