AI BENCHY श्रेणी
सामान्य ज्ञान रैंकिंग
देखें कि सामान्य ज्ञान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: सही परीक्षण ↓.
169/169
मॉडल फ़िल्टर करें
मौजूदा खोज और फ़िल्टर से कोई मॉडल मेल नहीं खाता।
| रैंक | मॉडल | कंपनी | सामान्य ज्ञान स्कोर | स्कोर | कुल लागत | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|---|
| #151 | Mercury 2 none | Inception | 3.0 | 4.6 | $0.011 | 0/1 | 548ms |
| #152 | Elephant Alpha none | Openrouter | 3.0 | 4.6 | $0.000 | 0/1 | 0ms |
| #153 | Elephant Alpha medium | Openrouter | 3.0 | 4.5 | $0.000 | 0/1 | 0ms |
| #154 | Hunter Alpha none | OpenRouter | 0.0 | 4.5 | $0.000 | 0/0 | 0ms |
| #155 | Grok 4.20 none | X AI | 0.0 | 4.4 | $0.057 | 0/0 | 0ms |
| #156 | Laguna Xs.2 medium | Poolside | 3.0 | 4.3 | $0.000 | 0/1 | 0ms |
| #157 | GLM 4.7 Flash medium | Z.ai | 3.0 | 4.3 | $0.054 | 0/1 | 11.1s |
| #158 | Hy3 preview none | Tencent | 3.0 | 4.3 | $0.003 | 0/1 | 2.71s |
| #159 | MiMo-V2-Flash none | Xiaomi | 3.0 | 4.3 | $0.025 | 0/1 | 1.82s |
| #160 | Grok Build 0.1 none | X AI | 3.0 | 4.2 | $0.547 | 0/1 | 36.1s |
| #161 | Grok 4.1 Fast none | X AI | 3.0 | 4.0 | $0.008 | 0/1 | 731ms |
| #162 | Laguna Xs.2 none | Poolside | 3.0 | 4.0 | $0.000 | 0/1 | 0ms |
| #163 | Granite 4.1 8B none | IBM Granite | 3.0 | 4.0 | $0.003 | 0/1 | 306ms |
| #164 | gpt-oss-120b none | OpenAI | 3.0 | 4.0 | $0.010 | 0/1 | 47.3s |
| #165 | Qwen3.5-9B medium | Qwen | 3.0 | 3.8 | $0.036 | 0/1 | 177.0s |