AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY زمرہ

اینٹی اے آئی چالیں درجہ بندی

دیکھیں کہ اینٹی اے آئی چالیں میں کون سے AI ماڈلز بہترین کارکردگی دکھاتے ہیں، کون سے قابلِ اعتماد رہتے ہیں، اور سب سے بڑے فرق کہاں نظر آتے ہیں۔ ترتیب دیں حسب: میٹرک ↑.

دکھائے گئے ماڈلز

15

اوسط اینٹی اے آئی چالیں اسکور

6.7

بہترین ماڈل

Seed-2.0-Lite 3.0
درجہ ماڈل کمپنی اینٹی اے آئی چالیں اسکور اسکور درست ٹیسٹس ردِعمل کا وقت (اوسط)
#8 Qwen3.5 Plus 2026-02-15 medium Qwen 8.2 8.5 3/4 45.8s
#47 Grok 4.20 medium X AI 8.2 7.0 3/4 3.36s
#3 Claude Opus 4.7 medium Anthropic 8.3 9.2 3/4 1.85s
#4 Claude Opus 4.7 none Anthropic 8.3 9.2 3/4 2.12s
#6 Seed-2.0-Lite medium Bytedance Seed 8.3 8.6 3/4 18.0s
#16 GPT-5.4 medium OpenAI 8.3 8.2 3/4 4.11s
#21 Gemini 3 Flash Preview none Google 8.3 8.1 3/4 1.25s
#22 Gemini 3.1 Flash Lite Preview low Google 8.3 8.1 3/4 2.12s
#38 GPT-5.4 Nano medium OpenAI 8.3 7.6 3/4 4.52s
#60 Gemma 4 26B A4B none Google 8.3 6.2 3/4 1.28s
#27 DeepSeek V3.2 medium DeepSeek 8.4 8.0 3/4 30.7s
#15 Gemini 2.5 Flash medium Google 8.4 8.2 3/4 6.30s
#44 GPT-5.4 Mini medium OpenAI 8.6 7.3 3/4 4.05s
#7 GPT-5.3-Codex medium OpenAI 8.7 8.6 3/4 4.16s
#10 Qwen3.5-27B medium Qwen 8.7 8.4 3/4 19.8s

اینٹی اے آئی چالیں اسکور کے لحاظ سے سرفہرست ماڈلز

اینٹی اے آئی چالیں اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز