AI BENCHY श्रेणी
सामान्य ज्ञान रैंकिंग
देखें कि सामान्य ज्ञान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: कुल लागत ↓.
169/169
मॉडल फ़िल्टर करें
मौजूदा खोज और फ़िल्टर से कोई मॉडल मेल नहीं खाता।
| रैंक | मॉडल | कंपनी | सामान्य ज्ञान स्कोर | स्कोर | कुल लागत | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|---|
| #29 | Qwen3.5-27B medium | Qwen | 3.0 | 7.9 | $0.536 | 0/1 | 85.1s |
| #27 | GPT-5.4 Mini medium | OpenAI | 3.0 | 8.0 | $0.526 | 0/1 | 30.1s |
| #3 | Qwen3.7 Max medium | Qwen | 3.0 | 9.4 | $0.523 | 0/1 | 33.4s |
| #49 | Claude Opus 4.7 none | Anthropic | 3.0 | 7.4 | $0.505 | 0/1 | 1.46s |
| #56 | GLM 5V Turbo medium | Z.ai | 3.0 | 7.3 | $0.457 | 0/1 | 41.0s |
| #81 | Qwen3.6 27B medium | Qwen | 3.0 | 6.6 | $0.440 | 0/1 | 81.0s |
| #45 | GPT-5.3 Chat none | OpenAI | 3.0 | 7.5 | $0.433 | 0/1 | 4.38s |
| #89 | Qwen3.5-35B-A3B medium | Qwen | 3.0 | 6.3 | $0.401 | 0/1 | 177.4s |
| #19 | GPT-5.2 Chat none | OpenAI | 3.0 | 8.5 | $0.393 | 0/1 | 6.89s |
| #91 | Gemini 3 PRO Preview medium | 3.0 | 6.2 | $0.385 | 0/1 | 0ms | |
| #24 | Gemini 2.5 Flash medium | 3.0 | 8.2 | $0.379 | 0/1 | 2.76s | |
| #20 | Step 3.7 Flash medium | Stepfun | 3.0 | 8.5 | $0.376 | 0/1 | 114.0s |
| #5 | Gemini 3.5 Flash low | 10.0 | 9.2 | $0.349 | 1/1 | 1.88s | |
| #43 | Kimi K2.5 medium | Moonshot AI | 3.0 | 7.5 | $0.348 | 0/1 | 83.9s |
| #39 | Step 3.7 Flash low | Stepfun | 3.0 | 7.7 | $0.341 | 0/1 | 124.8s |