اینٹی اے آئی چالیں ماڈل درجہ بندی

AI BENCHY زمرہ

دیکھیں کہ اینٹی اے آئی چالیں میں کون سے AI ماڈلز بہترین کارکردگی دکھاتے ہیں، کون سے قابلِ اعتماد رہتے ہیں، اور سب سے بڑے فرق کہاں نظر آتے ہیں۔ ترتیب دیں حسب: درست ٹیسٹس ↓.

دکھائے گئے ماڈلز

اوسط اینٹی اے آئی چالیں اسکور

6.9

بہترین ماڈل

Gemini 3 Flash Preview 10.0

ناکامی کی وجوہات

ناکامی کی وجہ غلط جواب کے ساتھ245 ناکامی کی وجہ ہدایات پر عمل نہیں کیا کے ساتھ30 ناکامی کی وجہ اضافی فارمیٹنگ کے ساتھ14 ناکامی کی وجہ API خرابی کے ساتھ13 ناکامی کی وجہ ٹائم آؤٹ کے ساتھ4 ناکامی کی وجہ کوئی جواب نہیں کے ساتھ2

درجہ	ماڈل	کمپنی	اینٹی اے آئی چالیں اسکور	اسکور	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#1	Gemini 3 Flash Preview medium	Google	10.0	9.8	4/4	3.88s
#2	Gemini 3.5 Flash high	Google	10.0	9.6	4/4	2.57s
#3	Gemini 3.5 Flash low	Google	10.0	9.4	4/4	2.52s
#4	Gemini 3.1 Pro Preview medium	Google	10.0	9.4	4/4	7.90s
#5	Qwen3.7 Max medium	Qwen	10.0	9.1	4/4	6.36s
#6	GPT-5.5 low	OpenAI	10.0	9.0	4/4	4.41s
#7	Gemini 3.5 Flash medium	Google	10.0	9.0	4/4	2.09s
#9	GPT-5.5 medium	OpenAI	10.0	8.8	4/4	4.66s
#10	Claude Opus 4.8 medium	Anthropic	10.0	8.7	4/4	3.95s
#12	Gemini 3.1 Flash Lite Preview high	Google	10.0	8.6	3/3	43.9s
#14	Qwen3.6 Max Preview medium	Qwen	10.0	8.5	4/4	22.1s
#16	Gemini 3 Flash Preview low	Google	10.0	8.4	4/4	3.48s
#17	GLM 5 medium	Z.ai	10.0	8.3	4/4	23.7s
#18	Qwen3.7 Plus medium	Qwen	10.0	8.2	4/4	8.58s
#20	Gemini 3.5 Flash none	Google	10.0	8.1	4/4	2.53s

1 2 11

→

اینٹی اے آئی چالیں درجہ بندی

اینٹی اے آئی چالیں اسکور کے لحاظ سے سرفہرست ماڈلز

اینٹی اے آئی چالیں اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز