AI BENCHY श्रेणी
संयुक्त रैंकिंग
देखें कि संयुक्त में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↑.
| रैंक | मॉडल | कंपनी | संयुक्त स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #24 | GPT-5.2 Chat none | OpenAI | 10.0 | 7.9 | 1/1 | 9.12s |
| #115 | Qwen3.5-27B none | Qwen | 2.8 | 5.7 | 0/1 | 9.39s |
| #6 | GPT-5.5 low | OpenAI | 10.0 | 9.0 | 1/1 | 9.56s |
| #118 | Qwen3.6 27B none | Qwen | 3.0 | 5.6 | 0/1 | 9.95s |
| #111 | Owl Alpha medium | Openrouter | 3.0 | 5.7 | 0/1 | 10.0s |
| #35 | Gemini 3 PRO Preview medium | 3.0 | 7.6 | 0/1 | 10.4s | |
| #44 | Gemini 3.1 Flash Lite medium | 10.0 | 7.5 | 1/1 | 10.9s | |
| #50 | Gemini 3.1 Flash Lite Preview low | 3.0 | 7.4 | 0/1 | 11.9s | |
| #63 | GPT-5.3 Chat none | OpenAI | 10.0 | 7.2 | 1/1 | 12.0s |
| #7 | Gemini 3.5 Flash medium | 10.0 | 9.0 | 1/1 | 12.0s | |
| #71 | Step 3.7 Flash high | Stepfun | 10.0 | 7.0 | 1/1 | 13.0s |
| #114 | Qwen3.5 Plus 2026-04-20 none | Qwen | 2.8 | 5.7 | 0/1 | 13.3s |
| #23 | GLM 5 Turbo medium | Z.ai | 10.0 | 8.0 | 1/1 | 13.9s |
| #42 | GPT-5.2 medium | OpenAI | 10.0 | 7.5 | 1/1 | 14.1s |
| #40 | Gemini 3.1 Flash Lite Preview medium | 10.0 | 7.5 | 1/1 | 14.9s |