AI BENCHY श्रेणी
संयुक्त क्रमवारी
संयुक्त मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: प्रतिसाद वेळ (सरासरी) ↑.
| क्रमांक | मॉडेल | कंपनी | संयुक्त स्कोअर | स्कोअर | बरोबर चाचण्या | प्रतिसाद वेळ (सरासरी) |
|---|---|---|---|---|---|---|
| #54 | GPT-5 Mini medium | OpenAI | 10.0 | 7.3 | 1/1 | 88.2s |
| #36 | Qwen3.5 Plus 2026-04-20 medium | Qwen | 10.0 | 7.6 | 1/1 | 92.4s |
| #72 | DeepSeek V3.2 medium | DeepSeek | 10.0 | 7.0 | 1/1 | 93.1s |
| #29 | Qwen3.5-122B-A10B medium | Qwen | 10.0 | 7.8 | 1/1 | 107.8s |
| #139 | DeepSeek V4 Flash none | DeepSeek | 4.5 | 5.0 | 0/1 | 112.0s |
| #82 | Hy3 preview high | Tencent | 10.0 | 6.6 | 1/1 | 113.1s |
| #133 | DeepSeek V3.2 none | DeepSeek | 6.5 | 5.2 | 0/1 | 115.9s |
| #14 | Qwen3.6 Max Preview medium | Qwen | 10.0 | 8.5 | 1/1 | 121.5s |
| #53 | Gemini 3.1 Flash Lite high | 10.0 | 7.3 | 1/1 | 149.2s | |
| #30 | Qwen3.5-27B medium | Qwen | 10.0 | 7.8 | 1/1 | 164.0s |
| #73 | Seed-2.0-Mini medium | Bytedance Seed | 10.0 | 6.9 | 1/1 | 262.8s |
| #12 | Gemini 3.1 Flash Lite Preview high | 10.0 | 8.6 | 1/1 | 280.5s | |
| #75 | Ring-2.6-1T medium | Inclusionai | 10.0 | 6.9 | 1/1 | 304.2s |