AI BENCHY श्रेणी
सामान्य ज्ञान रैंकिंग
देखें कि सामान्य ज्ञान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: मेट्रिक ↑.
विफलता के कारण
| रैंक | मॉडल | कंपनी | सामान्य ज्ञान स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #10 | Gemini 3 PRO Preview medium | 0.0 | 8.4 | 0/0 | 0ms | |
| #15 | Qwen3.6 Plus Preview medium | Qwen | 0.0 | 8.2 | 0/0 | 0ms |
| #63 | Laguna M.1 medium | Poolside | 0.0 | 6.9 | 0/0 | 0ms |
| #75 | Laguna Xs.2 medium | Poolside | 0.0 | 6.6 | 0/0 | 0ms |
| #109 | Elephant Alpha medium | Openrouter | 0.0 | 5.5 | 0/0 | 0ms |
| #111 | Nemotron 3 Nano Omni 30b A3b Reasoning medium | NVIDIA | 0.0 | 5.4 | 0/0 | 0ms |
| #115 | Laguna M.1 none | Poolside | 0.0 | 5.4 | 0/0 | 0ms |
| #116 | Elephant Alpha none | Openrouter | 0.0 | 5.3 | 0/0 | 0ms |
| #117 | Laguna Xs.2 none | Poolside | 0.0 | 5.3 | 0/0 | 0ms |
| #134 | Nemotron 3 Nano Omni 30b A3b Reasoning none | NVIDIA | 0.0 | 4.6 | 0/0 | 0ms |
| #138 | Ling-2.6-1T none | Inclusionai | 0.0 | 4.5 | 0/0 | 0ms |
| #4 | GPT-5.5 medium | OpenAI | 2.8 | 8.9 | 0/1 | 37.9s |
| #13 | GPT-5.3-Codex medium | OpenAI | 2.8 | 8.2 | 0/1 | 14.4s |
| #3 | Claude Opus 4.7 medium | Anthropic | 3.0 | 8.9 | 0/1 | 2.25s |
| #5 | Claude Opus 4.7 none | Anthropic | 3.0 | 8.9 | 0/1 | 1.46s |