AI BENCHY श्रेणी
सामान्य ज्ञान रैंकिंग
देखें कि सामान्य ज्ञान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: सही परीक्षण ↑.
169/169
मॉडल फ़िल्टर करें
मौजूदा खोज और फ़िल्टर से कोई मॉडल मेल नहीं खाता।
| रैंक | मॉडल | कंपनी | सामान्य ज्ञान स्कोर | स्कोर | कुल लागत | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|---|
| #51 | MiMo-V2.5-Pro medium | Xiaomi | 3.0 | 7.4 | $0.106 | 0/1 | 12.5s |
| #53 | Grok 4.20 medium | X AI | 3.0 | 7.3 | $0.609 | 0/1 | 63.5s |
| #54 | Hy3 preview medium | Tencent | 3.0 | 7.3 | $0.021 | 0/1 | 39.9s |
| #55 | Claude Sonnet 4.6 none | Anthropic | 3.0 | 7.3 | $0.316 | 0/1 | 4.67s |
| #56 | GLM 5V Turbo medium | Z.ai | 3.0 | 7.3 | $0.457 | 0/1 | 41.0s |
| #57 | Claude Opus 4.8 none | Anthropic | 3.0 | 7.2 | $0.539 | 0/1 | 3.41s |
| #58 | DeepSeek V4 Pro none | DeepSeek | 3.0 | 7.2 | $0.034 | 0/1 | 5.76s |
| #59 | Gemma 4 26B A4B medium | 3.0 | 7.2 | $0.045 | 0/1 | 180.9s | |
| #60 | Qwen3.7 Plus none | Qwen | 3.0 | 7.2 | $0.023 | 0/1 | 1.21s |
| #61 | GLM 5.2 none | Z.ai | 3.0 | 7.1 | $0.076 | 0/1 | 3.41s |
| #62 | MiMo-V2-Flash medium | Xiaomi | 3.0 | 7.1 | $0.043 | 0/1 | 1.96s |
| #63 | Step 3.7 Flash high | Stepfun | 3.0 | 7.1 | $1.148 | 0/1 | 149.3s |
| #64 | GLM 5.1 medium | Z.ai | 3.0 | 7.1 | $0.292 | 0/1 | 29.4s |
| #65 | Kimi K2.7 Code medium | Moonshot AI | 3.0 | 7.0 | $0.583 | 0/1 | 341.8s |
| #66 | Gemini 3.5 Flash none | 2.8 | 7.0 | $1.079 | 0/1 | 4.87s |