तुलना करें चार्ट Karyapranali

भाषा:

❤️ Made by XCS

AI BENCHY तुलना

Trinity Large Preview vs OpenAI: gpt-oss-120b

तुलना करें:

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-06

मेट्रिक	Trinity Large Preview none रिलीज़: 2026-01-27 निःशुल्क उपलब्ध	OpenAI: gpt-oss-120b medium रिलीज़: 2025-08-05 निःशुल्क उपलब्ध
रैंक	#45	#39
औसत स्कोर	4.2	5.1
संगति	9.6	7.4
प्रति परिणाम लागत	0.000	0.135
कुल लागत	$0.000	$0.010
सही परीक्षण
प्रति प्रयास पास दर	33.3%	54.2%
अस्थिर टेस्ट	1	5
कुल रन	48	48
आउटपुट टोकन	1,837	13,210
रीजनिंग टोकन	0	34,230
प्रतिक्रिया समय (औसत)	3.15s	16.65s
प्रतिक्रिया समय (अधिकतम)	8.91s	50.92s
प्रतिक्रिया समय (कुल)	50.46s	149.88s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

औसत स्कोर vs प्रतिक्रिया समय (औसत)

श्रेणी विवरण

एंटी-एआई ट्रिक्स	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Trinity Large Preview	10.0	10.0	0.0%	0		3.59s	587	0
OpenAI: gpt-oss-120b	7.0	9.8	66.7%	0		19.76s	3,463	2,077

संयुक्त	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Trinity Large Preview	10.0	10.0	0.0%	0		8.91s	294	0
OpenAI: gpt-oss-120b	10.0	10.0	100.0%	0		31.18s	694	5,072

डेटा पार्सिंग और निष्कर्षण	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Trinity Large Preview	9.9	10.0	100.0%	0		3.26s	186	0
OpenAI: gpt-oss-120b	5.5	5.9	66.7%	1		1.98s	241	1,114

डोमेन-विशिष्ट	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Trinity Large Preview	4.0	10.0	33.3%	0		877ms	25	0
OpenAI: gpt-oss-120b	10.0	4.4	22.2%	2		50.92s	6,784	20,606

Samanya Buddhimatta	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Trinity Large Preview	3.0	9.9	0.0%	0		2.86s	124	0
OpenAI: gpt-oss-120b	3.0	10.0	0.0%	0		7.90s	107	387

निर्देश पालन	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Trinity Large Preview	3.5	6.7	16.7%	1		1.09s	63	0
OpenAI: gpt-oss-120b	9.5	10.0	100.0%	0		7.63s	126	1,799

Puzzle Solving	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Trinity Large Preview	4.0	10.0	33.3%	0		3.30s	291	0
OpenAI: gpt-oss-120b	1.7	4.7	22.2%	2		11.80s	1,508	2,092

टूल कॉलिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Trinity Large Preview	10.0	10.0	100.0%	0		6.67s	267	0
OpenAI: gpt-oss-120b	9.0	10.0	100.0%	0		6.91s	287	1,083

त्वरित तुलना

तुलना जोड़ी बदलें

gpt-oss-120bmediumनिःशुल्क उपलब्धvsQwen3.5-122B-A10Bnone Gemini 2.5 Flashnonevsgpt-oss-120bmediumनिःशुल्क उपलब्ध gpt-oss-120bmediumनिःशुल्क उपलब्धvsQwen3.5-Flashnone gpt-oss-120bmediumनिःशुल्क उपलब्धvsQwen3.5-27Bnone gpt-oss-120bmediumनिःशुल्क उपलब्धvsQwen3.5-35B-A3Bnone DeepSeek V3.2nonevsgpt-oss-120bmediumनिःशुल्क उपलब्ध Trinity Large Previewnoneनिःशुल्क उपलब्धvsMiniMax M2.5medium Trinity Large Previewnoneनिःशुल्क उपलब्धvsQwen3 Coder Nextmedium gpt-oss-120bmediumनिःशुल्क उपलब्धvsGLM 5none Kimi K2.5nonevsgpt-oss-120bmediumनिःशुल्क उपलब्ध Trinity Large Previewnoneनिःशुल्क उपलब्धvsMercury 2medium gpt-oss-120bmediumनिःशुल्क उपलब्धvsQwen3 Coder Nextnone