AI BENCHY زمرہ
معلومات عامہ درجہ بندی
دیکھیں کہ معلومات عامہ میں کون سے AI ماڈلز بہترین کارکردگی دکھاتے ہیں، کون سے قابلِ اعتماد رہتے ہیں، اور سب سے بڑے فرق کہاں نظر آتے ہیں۔ ترتیب دیں حسب: کل لاگت ↓.
169/169
ماڈلز فلٹر کریں
موجودہ تلاش اور فلٹرز سے کوئی ماڈل مطابقت نہیں رکھتا۔
| درجہ | ماڈل | کمپنی | معلومات عامہ اسکور | اسکور | کل لاگت | درست ٹیسٹس | ردِعمل کا وقت (اوسط) |
|---|---|---|---|---|---|---|---|
| #84 | Gemini 3.1 Flash Lite Preview none | 3.0 | 6.4 | $0.018 | 0/1 | 814ms | |
| #126 | DeepSeek V3.2 none | DeepSeek | 3.0 | 5.3 | $0.017 | 0/1 | 17.2s |
| #119 | MiMo-V2.5-Pro none | Xiaomi | 3.0 | 5.5 | $0.017 | 0/1 | 1.89s |
| #106 | Qwen3.5 Plus 2026-02-15 none | Qwen | 3.0 | 5.8 | $0.016 | 0/1 | 1.11s |
| #93 | Gemini 2.5 Flash none | 3.0 | 6.2 | $0.016 | 0/1 | 1.15s | |
| #104 | Qwen3.5-27B none | Qwen | 3.0 | 5.9 | $0.015 | 0/1 | 599ms |
| #102 | Qwen3.6 Flash none | Qwen | 3.0 | 6.0 | $0.015 | 0/1 | 649ms |
| #94 | Gemini 3.1 Flash Lite minimal | 3.0 | 6.1 | $0.013 | 0/1 | 724ms | |
| #96 | Gemini 3.1 Flash Lite none | 3.0 | 6.1 | $0.013 | 0/1 | 733ms | |
| #78 | gpt-oss-120b medium | OpenAI | 3.0 | 6.7 | $0.013 | 0/1 | 26.5s |
| #103 | Qwen3.5-35B-A3B none | Qwen | 3.0 | 5.9 | $0.012 | 0/1 | 493ms |
| #151 | Mercury 2 none | Inception | 3.0 | 4.6 | $0.011 | 0/1 | 548ms |
| #145 | GPT-5.4 Nano none | OpenAI | 3.0 | 4.8 | $0.011 | 0/1 | 773ms |
| #164 | gpt-oss-120b none | OpenAI | 3.0 | 4.0 | $0.010 | 0/1 | 47.3s |
| #130 | Qwen3 Coder Next none | Qwen | 3.0 | 5.1 | $0.009 | 0/1 | 601ms |