AI BENCHY Compare

OpenAI: gpt-oss-120b vs Laguna M.1

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-29

मेट्रिक	gpt-oss-120b gpt-oss-120b none प्रकाशन: 2025-08-05 मोफत उपलब्ध	Laguna M.1 Laguna M.1 none प्रकाशन: 2026-04-28 मोफत उपलब्ध

मेट्रिक	gpt-oss-120b gpt-oss-120b none प्रकाशन: 2025-08-05 मोफत उपलब्ध	Laguna M.1 Laguna M.1 none प्रकाशन: 2026-04-28 मोफत उपलब्ध
स्कोअर	5.2	5.1
क्रमांक	#110	#117
विश्वसनीयता	लागू नाही	9.9
सुसंगतता	7.9	8.7
बरोबर चाचण्या
प्रति प्रयत्न पास दर	38.9%	33.3%
अस्थिर चाचण्या	5	3
एकूण रन	54	54
प्रति निकाल खर्च	0.221	0.000
एकूण खर्च	$0.009	$0.000
???? ???	$0.000 / 1M	$0.000 / 1M
????? ???	$0.000 / 1M	$0.000 / 1M
आउटपुट टोकन्स	44,652	2,870
रिझनिंग टोकन्स	0	0
प्रतिसाद वेळ (सरासरी)	11.96s	2.79s
प्रतिसाद वेळ (कमाल)	68.97s	15.42s
प्रतिसाद वेळ (एकूण)	179.34s	50.24s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	आउटपुट टोकन्स	रिझनिंग टोकन्स
gpt-oss-120b	6.6	8.0	58.3%	1		6.03s	4,867	0
Laguna M.1	3.4	7.9	16.7%	1		1.23s	485	0

कोडिंग	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	आउटपुट टोकन्स	रिझनिंग टोकन्स
gpt-oss-120b	4.3	1.1	66.7%	1		9.57s	3,232	0
Laguna M.1	7.5	3.8	66.7%	1		2.93s	543	0

संयुक्त	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	आउटपुट टोकन्स	रिझनिंग टोकन्स
gpt-oss-120b	3.0	10.0	0.0%	0		0ms	0	0
Laguna M.1	3.0	10.0	0.0%	0		4.32s	622	0

डेटा पार्सिंग आणि निष्कर्षण	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	आउटपुट टोकन्स	रिझनिंग टोकन्स
gpt-oss-120b	6.5	10.0	50.0%	0		7.12s	598	0
Laguna M.1	10.0	10.0	100.0%	0		3.37s	246	0

डोमेन-विशिष्ट	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	आउटपुट टोकन्स	रिझनिंग टोकन्स
gpt-oss-120b	3.0	10.0	0.0%	0		34.98s	29,483	0
Laguna M.1	3.6	7.2	22.2%	1		5.50s	33	0

Samanya Buddhimatta	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	आउटपुट टोकन्स	रिझनिंग टोकन्स
gpt-oss-120b	4.6	10.0	0.0%	0		2.83s	586	0
Laguna M.1	4.0	10.0	0.0%	0		3.08s	212	0

सूचनांचे पालन	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	आउटपुट टोकन्स	रिझनिंग टोकन्स
gpt-oss-120b	8.4	6.9	83.3%	1		5.10s	1,982	0
Laguna M.1	6.3	10.0	50.0%	0		683ms	80	0

कोडी सोडवणे	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	आउटपुट टोकन्स	रिझनिंग टोकन्स
gpt-oss-120b	4.5	4.8	44.5%	2		6.86s	3,904	0
Laguna M.1	3.2	10.0	0.0%	0		951ms	340	0

टूल कॉलिंग	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	आउटपुट टोकन्स	रिझनिंग टोकन्स
gpt-oss-120b	3.0	10.0	0.0%	0		0ms	0	0
Laguna M.1	10.0	10.0	100.0%	0		7.54s	309	0

झटपट तुलना

तुलना जोडी बदला

Nemotron 3 Nano Omni 30b A3b Reasoningmediumमोफत उपलब्धvsgpt-oss-120bnoneमोफत उपलब्ध gpt-oss-120bnoneमोफत उपलब्धvsElephant Alphamedium MiniMax M2.7mediumvsgpt-oss-120bnoneमोफत उपलब्ध Nemotron 3 Nano Omni 30b A3b Reasoningmediumमोफत उपलब्धvsLaguna M.1noneमोफत उपलब्ध Elephant AlphamediumvsLaguna M.1noneमोफत उपलब्ध MiniMax M2.7mediumvsLaguna M.1noneमोफत उपलब्ध Laguna M.1noneमोफत उपलब्धvsQwen3 Coder Nextmedium Mistral Small 4mediumvsgpt-oss-120bnoneमोफत उपलब्ध Laguna M.1noneमोफत उपलब्धvsGLM 4.7 Flashmedium gpt-oss-120bnoneमोफत उपलब्धvsQwen3 Coder Nextmedium MiniMax M2.5mediumमोफत उपलब्धvsgpt-oss-120bnoneमोफत उपलब्ध Mistral Small 4mediumvsLaguna M.1noneमोफत उपलब्ध