AI BENCHY तुलना

OpenAI: gpt-oss-120b vs Owl Alpha

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-01

मेट्रिक	gpt-oss-120b gpt-oss-120b none रिलीज़: 2025-08-05 निःशुल्क उपलब्ध	Owl Alpha Owl Alpha medium रिलीज़: 2026-04-30

मेट्रिक	gpt-oss-120b gpt-oss-120b none रिलीज़: 2025-08-05 निःशुल्क उपलब्ध	Owl Alpha Owl Alpha medium रिलीज़: 2026-04-30
स्कोर	5.4	5.8
रैंक	#106	#92
विश्वसनीयता	लागू नहीं	10.0
संगति	8.2	9.5
सही परीक्षण
प्रति प्रयास पास दर	40.7%	40.7%
अस्थिर टेस्ट	4	1
कुल रन	54	54
प्रति परिणाम लागत	0.177	0.000
कुल लागत	$0.009	$0.000
???? ???	$0.000 / 1M	$0.000 / 1M
????? ???	$0.000 / 1M	$0.000 / 1M
आउटपुट टोकन	44,652	1,596
रीजनिंग टोकन	0	0
प्रतिक्रिया समय (औसत)	11.96s	11.04s
प्रतिक्रिया समय (अधिकतम)	68.97s	58.63s
प्रतिक्रिया समय (कुल)	179.34s	198.65s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
gpt-oss-120b	6.6	8.0	58.3%	1		6.03s	4,867	0
Owl Alpha	4.8	10.0	25.0%	0		3.97s	87	0

कोडिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
gpt-oss-120b	4.3	1.1	66.7%	1		9.57s	3,232	0
Owl Alpha	10.0	10.0	100.0%	0		7.35s	402	0

संयुक्त	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
gpt-oss-120b	3.0	10.0	0.0%	0		0ms	0	0
Owl Alpha	3.0	10.0	0.0%	0		10.01s	315	0

डेटा पार्सिंग और निष्कर्षण	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
gpt-oss-120b	6.5	10.0	50.0%	0		7.12s	598	0
Owl Alpha	10.0	10.0	100.0%	0		21.64s	246	0

डोमेन-विशिष्ट	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
gpt-oss-120b	3.0	10.0	0.0%	0		34.98s	29,483	0
Owl Alpha	5.3	10.0	33.3%	0		8.58s	28	0

Samanya Buddhimatta	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
gpt-oss-120b	4.6	10.0	0.0%	0		2.83s	586	0
Owl Alpha	4.3	10.0	0.0%	0		58.63s	98	0

निर्देश पालन	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
gpt-oss-120b	9.8	10.0	100.0%	0		5.10s	1,982	0
Owl Alpha	6.3	10.0	50.0%	0		9.59s	57	0

पहेली समाधान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
gpt-oss-120b	4.5	4.8	44.5%	2		6.86s	3,904	0
Owl Alpha	3.4	7.2	11.1%	1		3.44s	135	0

टूल कॉलिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
gpt-oss-120b	3.0	10.0	0.0%	0		0ms	0	0
Owl Alpha	10.0	10.0	100.0%	0		8.26s	228	0

त्वरित तुलना

तुलना जोड़ी बदलें

Kimi K2.6nonevsOwl Alphamedium GPT-5.4nonevsOwl Alphamedium Owl AlphamediumvsQwen3.5-122B-A10Bnone Owl AlphamediumvsQwen3.5 Plus 2026-04-20none Owl AlphamediumvsMiMo-V2.5-Pronone Owl AlphamediumvsQwen3.6 Flashnone Owl AlphamediumvsGLM 5.1none MiniMax M2.7mediumvsgpt-oss-120bnoneनिःशुल्क उपलब्ध gpt-oss-120bnoneनिःशुल्क उपलब्धvsElephant Alphamedium Nemotron 3 Nano Omni 30b A3b Reasoningmediumनिःशुल्क उपलब्धvsgpt-oss-120bnoneनिःशुल्क उपलब्ध Owl AlphamediumvsMiMo-V2-Pronone DeepSeek V3.2nonevsOwl Alphamedium