AI BENCHY श्रेणी
सामान्य ज्ञान रैंकिंग
देखें कि सामान्य ज्ञान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: कुल लागत ↓.
169/169
मॉडल फ़िल्टर करें
मौजूदा खोज और फ़िल्टर से कोई मॉडल मेल नहीं खाता।
| रैंक | मॉडल | कंपनी | सामान्य ज्ञान स्कोर | स्कोर | कुल लागत | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|---|
| #100 | Qwen3.6 Max Preview none | Qwen | 3.0 | 6.0 | $0.075 | 0/1 | 1.97s |
| #34 | Gemini 3.1 Flash Lite medium | 3.0 | 7.8 | $0.071 | 0/1 | 3.08s | |
| #80 | Step 3.5 Flash medium | Stepfun | 3.0 | 6.6 | $0.070 | 0/1 | 108.4s |
| #115 | Grok 4.1 Fast medium | X AI | 3.0 | 5.6 | $0.069 | 0/1 | 25.5s |
| #32 | Gemini 3.1 Flash Lite Preview medium | 3.0 | 7.8 | $0.068 | 0/1 | 2.68s | |
| #133 | Mistral Small 4 medium | Mistral | 3.0 | 5.1 | $0.068 | 0/1 | 5.92s |
| #76 | MiMo-V2.5 medium | Xiaomi | 3.0 | 6.7 | $0.063 | 0/1 | 51.3s |
| #74 | Hy3 preview high | Tencent | 3.0 | 6.8 | $0.059 | 0/1 | 47.7s |
| #116 | GLM 5.1 none | Z.ai | 3.0 | 5.6 | $0.058 | 0/1 | 2.34s |
| #44 | Mercury 2 medium | Inception | 3.0 | 7.5 | $0.058 | 0/1 | 2.58s |
| #155 | Grok 4.20 none | X AI | 0.0 | 4.4 | $0.057 | 0/0 | 0ms |
| #68 | Qwen3.7 Max none | Qwen | 3.0 | 6.9 | $0.054 | 0/1 | 856ms |
| #157 | GLM 4.7 Flash medium | Z.ai | 3.0 | 4.3 | $0.054 | 0/1 | 11.1s |
| #105 | GLM 5V Turbo none | Z.ai | 3.0 | 5.9 | $0.052 | 0/1 | 2.23s |
| #123 | GLM 5 Turbo none | Z.ai | 3.0 | 5.3 | $0.047 | 0/1 | 2.37s |