AI BENCHY श्रेणी
संयुक्त रैंकिंग
देखें कि संयुक्त में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं।
| रैंक | मॉडल | कंपनी | संयुक्त स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #1 | Gemini 3 Flash Preview medium | 10.0 | 9.8 | 1/1 | 22.4s | |
| #2 | Gemini 3.5 Flash high | 10.0 | 9.6 | 1/1 | 22.4s | |
| #3 | Gemini 3.5 Flash low | 10.0 | 9.4 | 1/1 | 6.44s | |
| #5 | Qwen3.7 Max medium | Qwen | 10.0 | 9.1 | 1/1 | 19.6s |
| #6 | GPT-5.5 low | OpenAI | 10.0 | 9.0 | 1/1 | 9.56s |
| #7 | Gemini 3.5 Flash medium | 10.0 | 9.0 | 1/1 | 12.0s | |
| #9 | GPT-5.5 medium | OpenAI | 10.0 | 8.8 | 1/1 | 19.3s |
| #11 | Claude Opus 4.7 medium | Anthropic | 10.0 | 8.7 | 1/1 | 21.4s |
| #12 | Gemini 3.1 Flash Lite Preview high | 10.0 | 8.6 | 1/1 | 280.5s | |
| #13 | Grok 4.20 Beta medium | X AI | 10.0 | 8.5 | 1/1 | 20.9s |
| #14 | Qwen3.6 Max Preview medium | Qwen | 10.0 | 8.5 | 1/1 | 121.5s |
| #15 | GPT-5.3-Codex medium | OpenAI | 10.0 | 8.4 | 1/1 | 19.6s |
| #17 | GLM 5 medium | Z.ai | 10.0 | 8.3 | 1/1 | 29.0s |
| #18 | Qwen3.7 Plus medium | Qwen | 10.0 | 8.2 | 1/1 | 65.2s |
| #19 | Seed-2.0-Lite medium | Bytedance Seed | 10.0 | 8.2 | 1/1 | 37.7s |