#201

Laguna M.1

Poolside रिलीज़: 2026-04-28 परीक्षण किया गया: 2026-05-08 15:31 poolside/laguna-m.1::medium

(medium) (none)

सारांश

Laguna M.1 AI BENCHY पर 4.7 स्कोर करता है और #201 पर है। इसकी reliability 10.0, pass rate 45.5%, कुल लागत $0.033, और औसत response time 14.73s है।

Laguna M.1 को अलग क्या बनाता है: यह डेटा पार्सिंग और निष्कर्षण में सबसे अलग दिखता है, जहाँ इसकी रैंक #1 है; जबकि कोडिंग इसकी सबसे कमजोर जगह है, जहाँ यह #11 पर है।

संग्रहीत मॉडल: इस मॉडल को अब अपडेट नहीं किया जाएगा और नए परीक्षणों में टेस्ट नहीं किया जाएगा।

स्कोर

4.7

संगति

7.9

विश्वसनीयता

10.0

कुल लागत (वर्तमान कीमत)

$0.033 ↕ New

परीक्षण के समय: $0.000

कुल आउटपुट टोकन

58,087

कुल इनपुट टोकन

44,969

इनपुट कीमत

$0.200 / 1M

आउटपुट कीमत

$0.400 / 1M

सही परीक्षण

गलत टेस्ट: 10

प्रति प्रयास पास दर: 45.5%

अस्थिर टेस्ट

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

14.73s

प्रतिक्रिया समय (अधिकतम): 53.14s

प्रतिक्रिया समय (कुल): 220.93s

API त्रुटि: 4 गलत उत्तर: 4 निर्देशों का पालन नहीं किया: 1 कोई उत्तर नहीं: 1

कीमत का इतिहास

OpenRouter से इस मॉडल का ऐतिहासिक मूल्य डेटा।

तारीख	इनपुट कीमत	आउटपुट कीमत
2026-06-04 15:40	$0.000 / 1M	$0.000 / 1M
2026-06-29 01:00	$0.200 / 1M	$0.400 / 1M

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

श्रेणी	स्कोर	संगति
एंटी-एआई ट्रिक्स	6.5	10.0
कोडिंग	1.5	4.0
संयुक्त	1.5	5.0
डेटा पार्सिंग और निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	5.3	7.2
Samanya Buddhimatta	3.0	10.0
निर्देश पालन	10.0	10.0
पहेली समाधान	5.3	10.0
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

Laguna M.1

चार्ट

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

तुलना किए गए मॉडल