AI BENCHY श्रेणी
संयुक्त रैंकिंग
देखें कि संयुक्त में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: मेट्रिक ↑.
| रैंक | मॉडल | कंपनी | संयुक्त स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #7 | Gemini 3.5 Flash medium | 10.0 | 9.0 | 1/1 | 12.0s | |
| #9 | GPT-5.5 medium | OpenAI | 10.0 | 8.8 | 1/1 | 19.3s |
| #11 | Claude Opus 4.7 medium | Anthropic | 10.0 | 8.7 | 1/1 | 21.4s |
| #12 | Gemini 3.1 Flash Lite Preview high | 10.0 | 8.6 | 1/1 | 280.5s | |
| #13 | Grok 4.20 Beta medium | X AI | 10.0 | 8.5 | 1/1 | 20.9s |
| #14 | Qwen3.6 Max Preview medium | Qwen | 10.0 | 8.5 | 1/1 | 121.5s |
| #15 | GPT-5.3-Codex medium | OpenAI | 10.0 | 8.4 | 1/1 | 19.6s |
| #17 | GLM 5 medium | Z.ai | 10.0 | 8.3 | 1/1 | 29.0s |
| #18 | Qwen3.7 Plus medium | Qwen | 10.0 | 8.2 | 1/1 | 65.2s |
| #19 | Seed-2.0-Lite medium | Bytedance Seed | 10.0 | 8.2 | 1/1 | 37.7s |
| #21 | GPT-5.4 medium | OpenAI | 10.0 | 8.0 | 1/1 | 20.6s |
| #22 | Step 3.7 Flash medium | Stepfun | 10.0 | 8.0 | 1/1 | 9.06s |
| #23 | GLM 5 Turbo medium | Z.ai | 10.0 | 8.0 | 1/1 | 13.9s |
| #24 | GPT-5.2 Chat none | OpenAI | 10.0 | 7.9 | 1/1 | 9.12s |
| #25 | Qwen3.5 Plus 2026-02-15 medium | Qwen | 10.0 | 7.9 | 1/1 | 46.8s |