AI BENCHY Compare

OpenAI: gpt-oss-120b vs Laguna M.1

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-29

मेट्रिक	gpt-oss-120b gpt-oss-120b medium प्रकाशन: 2025-08-05 मोफत उपलब्ध	Laguna M.1 Laguna M.1 none प्रकाशन: 2026-04-28 मोफत उपलब्ध

मेट्रिक	gpt-oss-120b gpt-oss-120b medium प्रकाशन: 2025-08-05 मोफत उपलब्ध	Laguna M.1 Laguna M.1 none प्रकाशन: 2026-04-28 मोफत उपलब्ध
स्कोअर	5.8	5.1
क्रमांक	#88	#117
विश्वसनीयता	लागू नाही	9.9
सुसंगतता	7.2	8.7
बरोबर चाचण्या
प्रति प्रयत्न पास दर	51.9%	33.3%
अस्थिर चाचण्या	6	3
एकूण रन	54	54
प्रति निकाल खर्च	0.144	0.000
एकूण खर्च	$0.011	$0.000
???? ???	$0.000 / 1M	$0.000 / 1M
????? ???	$0.000 / 1M	$0.000 / 1M
आउटपुट टोकन्स	13,493	2,870
रिझनिंग टोकन्स	36,879	0
प्रतिसाद वेळ (सरासरी)	16.08s	2.79s
प्रतिसाद वेळ (कमाल)	50.92s	15.42s
प्रतिसाद वेळ (एकूण)	176.88s	50.24s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	आउटपुट टोकन्स	रिझनिंग टोकन्स
gpt-oss-120b	6.7	9.9	50.0%	0		10.21s	3,518	2,177
Laguna M.1	3.4	7.9	16.7%	1		1.23s	485	0

कोडिंग	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	आउटपुट टोकन्स	रिझनिंग टोकन्स
gpt-oss-120b	4.3	1.1	66.7%	1		26.33s	228	2,549
Laguna M.1	7.5	3.8	66.7%	1		2.93s	543	0

संयुक्त	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	आउटपुट टोकन्स	रिझनिंग टोकन्स
gpt-oss-120b	10.0	10.0	100.0%	0		31.18s	694	5,072
Laguna M.1	3.0	10.0	0.0%	0		4.32s	622	0

डेटा पार्सिंग आणि निष्कर्षण	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	आउटपुट टोकन्स	रिझनिंग टोकन्स
gpt-oss-120b	6.4	5.9	66.7%	1		1.98s	241	1,114
Laguna M.1	10.0	10.0	100.0%	0		3.37s	246	0

डोमेन-विशिष्ट	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	आउटपुट टोकन्स	रिझनिंग टोकन्स
gpt-oss-120b	2.9	4.4	22.2%	2		50.92s	6,784	20,606
Laguna M.1	3.6	7.2	22.2%	1		5.50s	33	0

Samanya Buddhimatta	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	आउटपुट टोकन्स	रिझनिंग टोकन्स
gpt-oss-120b	4.3	10.0	0.0%	0		7.90s	107	387
Laguna M.1	4.0	10.0	0.0%	0		3.08s	212	0

सूचनांचे पालन	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	आउटपुट टोकन्स	रिझनिंग टोकन्स
gpt-oss-120b	9.9	10.0	100.0%	0		7.63s	126	1,799
Laguna M.1	6.3	10.0	50.0%	0		683ms	80	0

कोडी सोडवणे	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	आउटपुट टोकन्स	रिझनिंग टोकन्स
gpt-oss-120b	3.2	4.7	22.2%	2		11.80s	1,508	2,092
Laguna M.1	3.2	10.0	0.0%	0		951ms	340	0

टूल कॉलिंग	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	आउटपुट टोकन्स	रिझनिंग टोकन्स
gpt-oss-120b	9.8	10.0	100.0%	0		6.91s	287	1,083
Laguna M.1	10.0	10.0	100.0%	0		7.54s	309	0

झटपट तुलना

तुलना जोडी बदला

Kimi K2.6nonevsgpt-oss-120bmediumमोफत उपलब्ध gpt-oss-120bmediumमोफत उपलब्धvsQwen3.5-27Bnone gpt-oss-120bmediumमोफत उपलब्धvsQwen3.5 Plus 2026-04-20none gpt-oss-120bmediumमोफत उपलब्धvsMiMo-V2.5-Pronone gpt-oss-120bmediumमोफत उपलब्धvsQwen3.6 Flashnone gpt-oss-120bmediumमोफत उपलब्धvsQwen3.5-122B-A10Bnone gpt-oss-120bmediumमोफत उपलब्धvsMiMo-V2-Pronone DeepSeek V3.2nonevsgpt-oss-120bmediumमोफत उपलब्ध Nemotron 3 Nano Omni 30b A3b Reasoningmediumमोफत उपलब्धvsLaguna M.1noneमोफत उपलब्ध Elephant AlphamediumvsLaguna M.1noneमोफत उपलब्ध gpt-oss-120bmediumमोफत उपलब्धvsQwen3.6 27Bnone MiniMax M2.7mediumvsLaguna M.1noneमोफत उपलब्ध