AI BENCHY श्रेणी
सामान्य ज्ञान क्रमवारी
सामान्य ज्ञान मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा.
169/169
मॉडेल फिल्टर करा
सध्याच्या शोध आणि फिल्टर्सशी जुळणारी कोणतीही मॉडेल्स नाहीत.
| क्रमांक | मॉडेल | कंपनी | सामान्य ज्ञान स्कोअर | स्कोअर | एकूण खर्च | बरोबर चाचण्या | प्रतिसाद वेळ (सरासरी) |
|---|---|---|---|---|---|---|---|
| #144 | Ring-2.6-1T none | Inclusionai | 3.0 | 4.8 | $0.026 | 0/1 | 133.6s |
| #145 | GPT-5.4 Nano none | OpenAI | 3.0 | 4.8 | $0.011 | 0/1 | 773ms |
| #146 | MiniMax M2.5 medium | Minimax | 3.0 | 4.7 | $0.303 | 0/1 | 80.8s |
| #147 | Ling-2.6-1T none | Inclusionai | 3.0 | 4.7 | $0.005 | 0/1 | 0ms |
| #148 | Qwen3 Coder Next medium | Qwen | 3.0 | 4.7 | $0.008 | 0/1 | 399ms |
| #150 | Laguna M.1 none | Poolside | 3.0 | 4.6 | $0.000 | 0/1 | 0ms |
| #151 | Mercury 2 none | Inception | 3.0 | 4.6 | $0.011 | 0/1 | 548ms |
| #152 | Elephant Alpha none | Openrouter | 3.0 | 4.6 | $0.000 | 0/1 | 0ms |
| #153 | Elephant Alpha medium | Openrouter | 3.0 | 4.5 | $0.000 | 0/1 | 0ms |
| #156 | Laguna Xs.2 medium | Poolside | 3.0 | 4.3 | $0.000 | 0/1 | 0ms |
| #157 | GLM 4.7 Flash medium | Z.ai | 3.0 | 4.3 | $0.054 | 0/1 | 11.1s |
| #158 | Hy3 preview none | Tencent | 3.0 | 4.3 | $0.003 | 0/1 | 2.71s |
| #159 | MiMo-V2-Flash none | Xiaomi | 3.0 | 4.3 | $0.025 | 0/1 | 1.82s |
| #160 | Grok Build 0.1 none | X AI | 3.0 | 4.2 | $0.547 | 0/1 | 36.1s |
| #161 | Grok 4.1 Fast none | X AI | 3.0 | 4.0 | $0.008 | 0/1 | 731ms |