Samanya Buddhimatta मॉडेल क्रमवारी

AI BENCHY श्रेणी

Samanya Buddhimatta मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा.

दाखवलेली मॉडेल्स

सरासरी Samanya Buddhimatta स्कोअर

6.1

सर्वोत्तम मॉडेल

Gemini 3 Flash Preview 10.0

संबंधित अपयश कारणे

सूचनांचे पालन केले नाही32 चुकीचे उत्तर6 वेळ संपला3

क्रमांक	मॉडेल	कंपनी	Samanya Buddhimatta स्कोअर	सरासरी स्कोअर	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)
#1	Gemini 3 Flash Preview medium	Google	10.0	10.0	1/1	4.09s
#2	Gemini 3.1 Pro Preview medium	Google	10.0	9.4	1/1	11.8s
#4	Qwen3.5 Plus 2026-02-15 medium	Qwen	10.0	8.3	0/1	79.9s
#5	Gemini 3 Flash Preview low	Google	10.0	8.2	1/1	3.68s
#6	Gemini 3 Pro Preview medium	Google	10.0	8.2	1/1	9.34s
#8	Gemini 3.1 Flash Lite Preview high	Google	10.0	8.2	1/1	5.25s
#10	Qwen3.5-122B-A10B medium	Qwen	10.0	7.7	0/1	34.1s
#11	Claude Sonnet 4.6 medium	Anthropic	10.0	7.7	1/1	4.94s
#12	Gemini 3.1 Flash Lite Preview medium	Google	10.0	7.5	1/1	3.16s
#20	Gemini 3 Flash Preview none	Google	10.0	7.2	1/1	1.13s
#26	Claude Opus 4.6 medium	Anthropic	10.0	6.6	1/1	5.04s
#27	GPT-5.2 medium	OpenAI	10.0	6.5	0/1	4.32s
#31	GLM 5 none	Z.ai	10.0	6.0	1/1	3.27s
#33	DeepSeek V3.2 none	DeepSeek	10.0	5.5	1/1	2.86s
#35	Qwen3.5-35B-A3B medium	Qwen	10.0	5.5	0/1	30.3s
#37	Qwen3.5-Flash none	Qwen	10.0	5.2	1/1	803ms
#46	Kimi K2.5 none	Moonshot AI	10.0	4.1	1/1	4.00s
#48	Qwen3 Coder Next none	Qwen	10.0	4.0	1/1	1.34s
#52	GLM 4.7 Flash medium	Z.ai	10.0	3.1	0/1	18.1s
#13	Step 3.5 Flash medium	Stepfun	6.0	7.4	0/1	6.54s
#23	Seed-2.0-Mini medium	Bytedance Seed	6.0	6.9	0/1	36.7s
#28	Kimi K2.5 medium	Moonshot AI	6.0	6.4	0/1	69.7s
#42	Qwen3.5-35B-A3B none	Qwen	6.0	4.7	0/1	1.19s
#50	Qwen3 Coder Next medium	Qwen	6.0	3.5	0/1	1.39s
#7	Qwen3.5-27B medium	Qwen	5.0	8.2	0/1	101.4s
#9	GPT-5.4 medium	OpenAI	5.0	8.0	0/1	4.92s
#14	GLM 5 medium	Z.ai	5.0	7.4	0/1	14.7s
#24	Qwen3.5-Flash medium	Qwen	5.0	6.9	0/1	40.1s
#25	Claude Sonnet 4.6 none	Anthropic	5.0	6.8	0/1	2.56s
#38	Gemini 2.5 Flash none	Google	5.0	5.2	0/1	615ms
#40	Qwen3.5-122B-A10B none	Qwen	5.0	5.0	0/1	1.12s
#41	Qwen3.5-27B none	Qwen	5.0	4.9	0/1	2.51s
#3	GPT-5.3-Codex medium	OpenAI	4.0	8.4	0/1	4.87s
#15	GPT-5.2 Chat none	OpenAI	4.0	7.4	0/1	3.20s
#16	Gemini 2.5 Flash medium	Google	4.0	7.4	0/1	4.86s
#19	GPT-5.3 Chat none	OpenAI	4.0	7.3	0/1	1.99s
#29	Qwen3.5 Plus 2026-02-15 none	Qwen	4.0	6.2	0/1	2.26s
#32	GPT-5 Mini medium	OpenAI	4.0	6.0	0/1	13.5s
#36	Mercury 2 medium	Inception	4.0	5.3	0/1	821ms
#51	Mercury 2 none	Inception	4.0	3.4	0/1	628ms
#54	MiMo-V2-Flash none	Xiaomi	4.0	2.9	0/1	1.67s
#17	Gemini 3.1 Flash Lite Preview low	Google	3.0	7.3	0/1	1.54s
#18	DeepSeek V3.2 medium	DeepSeek	3.0	7.3	0/1	31.3s
#21	MiMo-V2-Flash medium	Xiaomi	3.0	7.2	0/1	4.20s
#22	Gemini 3.1 Flash Lite Preview none	Google	3.0	7.1	0/1	741ms
#30	Grok 4.1 Fast medium	X AI	3.0	6.2	0/1	16.2s
#34	GPT-5 Nano medium	OpenAI	3.0	5.5	0/1	17.5s
#39	gpt-oss-120b medium	OpenAI	3.0	5.1	0/1	7.90s
#43	MiniMax M2.5 medium	Minimax	3.0	4.7	0/1	6.63s
#44	GPT-5.4 none	OpenAI	3.0	4.5	0/1	1.78s
#45	Trinity Large Preview none	Arcee AI	3.0	4.2	0/1	2.86s
#47	GPT-4o-mini none	OpenAI	3.0	4.0	0/1	909ms
#49	GLM 4.7 Flash none	Z.ai	3.0	3.9	0/1	1.59s
#53	Grok 4.1 Fast none	X AI	3.0	2.9	0/1	1.08s
#55	LFM2-24B-A2B none	Liquid	3.0	2.6	0/1	395ms

Samanya Buddhimatta क्रमवारी

Samanya Buddhimatta स्कोअर नुसार शीर्ष मॉडेल्स

Samanya Buddhimatta स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स