AI BENCHY तुलना

OpenAI: GPT-5 Mini vs Qwen: Qwen3.5-9B

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-12

मेट्रिक	GPT-5 Mini GPT-5 Mini medium रिलीज़: 2025-08-07	Qwen3.5-9B Qwen3.5-9B none रिलीज़: 2026-03-02

मेट्रिक	GPT-5 Mini GPT-5 Mini medium रिलीज़: 2025-08-07	Qwen3.5-9B Qwen3.5-9B none रिलीज़: 2026-03-02
रैंक	#34	#60
औसत स्कोर	6.0	3.4
संगति	8.9	10.0
प्रति परिणाम लागत	1.457	0.111
कुल लागत	$0.117	$0.005
सही परीक्षण
प्रति प्रयास पास दर	58.3%	25.0%
अस्थिर टेस्ट	2	0
कुल रन	48	48
आउटपुट टोकन	5,826	2,939
रीजनिंग टोकन	48,768	0
प्रतिक्रिया समय (औसत)	25.14s	1.06s
प्रतिक्रिया समय (अधिकतम)	88.15s	5.91s
प्रतिक्रिया समय (कुल)	402.29s	16.95s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

औसत स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

औसत स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
GPT-5 Mini	7.0	9.6	66.7%	0		16.45s	1,645	5,824
Qwen3.5-9B	10.0	9.9	0.0%	0		1.02s	576	0

संयुक्त	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
GPT-5 Mini	10.0	10.0	100.0%	0		88.15s	754	11,520
Qwen3.5-9B	10.0	10.0	0.0%	0		5.91s	1,255	0

डेटा पार्सिंग और निष्कर्षण	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
GPT-5 Mini	9.9	10.0	100.0%	0		12.58s	453	3,200
Qwen3.5-9B	9.9	10.0	100.0%	0		847ms	249	0

डोमेन-विशिष्ट	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
GPT-5 Mini	10.0	7.2	22.2%	1		44.63s	293	14,016
Qwen3.5-9B	10.0	10.0	0.0%	0		464ms	24	0

Samanya Buddhimatta	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
GPT-5 Mini	4.0	10.0	0.0%	0		13.50s	349	1,856
Qwen3.5-9B	3.0	9.9	0.0%	0		552ms	99	0

निर्देश पालन	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
GPT-5 Mini	7.5	6.6	83.3%	1		15.66s	318	4,992
Qwen3.5-9B	5.5	10.0	50.0%	0		514ms	75	0

Puzzle Solving	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
GPT-5 Mini	4.3	9.8	33.3%	0		14.09s	1,527	5,760
Qwen3.5-9B	10.0	9.9	0.0%	0		683ms	388	0

टूल कॉलिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
GPT-5 Mini	10.0	10.0	100.0%	0		18.64s	487	1,600
Qwen3.5-9B	10.0	10.0	100.0%	0		1.27s	273	0

त्वरित तुलना

तुलना जोड़ी बदलें

GPT-5 MinimediumvsGLM 5none GPT-5 MinimediumvsQwen3.5 Plus 2026-02-15none Qwen3.5-9BnonevsGLM 4.7 Flashmedium DeepSeek V3.2nonevsGPT-5 Minimedium Claude Sonnet 4.6nonevsGPT-5 Minimedium GPT-5 MinimediumvsQwen3.5-Flashnone Gemini 2.5 FlashnonevsGPT-5 Minimedium GPT-5 MinimediumvsQwen3.5-122B-A10Bnone Gemini 3.1 Flash Lite PreviewnonevsGPT-5 Minimedium Seed-2.0-LitenonevsGPT-5 Minimedium GPT-5 MinimediumvsQwen3.5-27Bnone Gemini 3 Flash PreviewnonevsGPT-5 Minimedium