AI BENCHY श्रेणी
सामान्य ज्ञान रैंकिंग
देखें कि सामान्य ज्ञान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: कुल लागत ↓.
169/169
मॉडल फ़िल्टर करें
मौजूदा खोज और फ़िल्टर से कोई मॉडल मेल नहीं खाता।
| रैंक | मॉडल | कंपनी | सामान्य ज्ञान स्कोर | स्कोर | कुल लागत | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|---|
| #136 | Grok 4.20 Multi Agent Beta medium | X AI | 0.0 | 5.0 | $5.599 | 0/0 | 0ms |
| #9 | GPT-5.5 medium | OpenAI | 2.8 | 9.0 | $3.679 | 0/1 | 37.9s |
| #6 | Claude Fable 5 medium | Anthropic | 3.0 | 9.2 | $3.165 | 0/1 | 25.6s |
| #95 | Gemini 3.1 Flash Lite Preview high | 0.0 | 6.1 | $2.310 | 0/0 | 0ms | |
| #38 | Claude Opus 4.6 medium | Anthropic | 3.0 | 7.7 | $2.053 | 0/1 | 63.2s |
| #83 | Gemini 3.1 Flash Lite high | 0.0 | 6.5 | $2.044 | 0/0 | 0ms | |
| #31 | Claude Sonnet 4.6 medium | Anthropic | 3.0 | 7.8 | $1.418 | 0/1 | 30.1s |
| #17 | GPT-5.4 medium | OpenAI | 3.0 | 8.5 | $1.210 | 0/1 | 14.0s |
| #63 | Step 3.7 Flash high | Stepfun | 3.0 | 7.1 | $1.148 | 0/1 | 149.3s |
| #1 | Gemini 3.5 Flash high | 10.0 | 9.8 | $1.115 | 1/1 | 3.94s | |
| #12 | Claude Opus 4.8 medium | Anthropic | 3.0 | 8.8 | $1.107 | 0/1 | 6.14s |
| #66 | Gemini 3.5 Flash none | 2.8 | 7.0 | $1.079 | 0/1 | 4.87s | |
| #7 | Gemini 3.1 Pro Preview medium | 10.0 | 9.2 | $1.054 | 1/1 | 6.27s | |
| #11 | Qwen3.6 Max Preview medium | Qwen | 3.0 | 8.9 | $0.960 | 0/1 | 60.6s |
| #42 | Grok Build 0.1 medium | X AI | 3.0 | 7.6 | $0.927 | 0/1 | 53.5s |