AI BENCHY श्रेणी
सामान्य ज्ञान रैंकिंग
देखें कि सामान्य ज्ञान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: सही परीक्षण ↓.
169/169
मॉडल फ़िल्टर करें
मौजूदा खोज और फ़िल्टर से कोई मॉडल मेल नहीं खाता।
| रैंक | मॉडल | कंपनी | सामान्य ज्ञान स्कोर | स्कोर | कुल लागत | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|---|
| #1 | Gemini 3.5 Flash high | 10.0 | 9.8 | $1.115 | 1/1 | 3.94s | |
| #2 | Gemini 3 Flash Preview medium | 10.0 | 9.6 | $0.667 | 1/1 | 5.50s | |
| #5 | Gemini 3.5 Flash low | 10.0 | 9.2 | $0.349 | 1/1 | 1.88s | |
| #7 | Gemini 3.1 Pro Preview medium | 10.0 | 9.2 | $1.054 | 1/1 | 6.27s | |
| #8 | Gemini 3.5 Flash medium | 10.0 | 9.1 | $0.582 | 1/1 | 2.75s | |
| #52 | Gemini 3 Flash Preview low | 10.0 | 7.4 | $0.111 | 1/1 | 2.75s | |
| #3 | Qwen3.7 Max medium | Qwen | 3.0 | 9.4 | $0.523 | 0/1 | 33.4s |
| #4 | GPT-5.5 low | OpenAI | 3.0 | 9.3 | $0.907 | 0/1 | 10.1s |
| #6 | Claude Fable 5 medium | Anthropic | 3.0 | 9.2 | $3.165 | 0/1 | 25.6s |
| #9 | GPT-5.5 medium | OpenAI | 2.8 | 9.0 | $3.679 | 0/1 | 37.9s |
| #10 | GPT-5.3-Codex medium | OpenAI | 2.8 | 8.9 | $0.740 | 0/1 | 14.4s |
| #11 | Qwen3.6 Max Preview medium | Qwen | 3.0 | 8.9 | $0.960 | 0/1 | 60.6s |
| #12 | Claude Opus 4.8 medium | Anthropic | 3.0 | 8.8 | $1.107 | 0/1 | 6.14s |
| #13 | Claude Opus 4.7 medium | Anthropic | 3.0 | 8.7 | $0.679 | 0/1 | 2.25s |
| #14 | GLM 5.2 medium | Z.ai | 3.0 | 8.7 | $0.324 | 0/1 | 34.2s |