AI BENCHY
Your ad here

Categorie AI BENCHY

Clasament Specific domeniului

Vezi ce modele AI se descurcă cel mai bine la Specific domeniului, care rămân fiabile și unde apar cele mai mari diferențe. Sortează după: Teste corecte ↓.

Modele afișate

15

Media pentru Scor Specific domeniului

4.8

Rang Model Companie Scor Specific domeniului Scor Teste corecte Timp de răspuns (mediu)
#53 GLM 5 none Z.ai 3.0 6.6 0/3 2.24s
#54 Mercury 2 medium Inception 2.9 6.5 0/3 6.48s
#56 Grok 4.20 Multi Agent Beta medium X AI 2.9 6.4 0/3 24.7s
#60 Gemma 4 26B A4B none Google 3.6 6.2 0/3 2.49s
#61 Seed-2.0-Lite none Bytedance Seed 3.6 6.2 0/3 1.33s
#64 DeepSeek V3.2 none DeepSeek 3.6 6.1 0/3 1.61s
#67 Qwen3.5-27B none Qwen 3.0 5.9 0/3 540ms
#68 gpt-oss-120b medium OpenAI 2.9 5.8 0/3 50.9s
#71 MiniMax M2.5 medium Minimax 2.9 5.7 0/3 237.3s
#75 GLM 5.1 none Z.ai 2.9 5.6 0/3 1.99s
#79 Grok 4.20 Beta none X AI 3.0 5.3 0/3 611ms
#80 MiniMax M2.7 medium Minimax 3.0 5.3 0/3 19.0s
#81 Elephant medium Openrouter 3.0 5.2 0/3 925ms
#82 Grok 4.20 none X AI 3.0 5.2 0/3 687ms
#84 gpt-oss-120b none OpenAI 3.0 5.2 0/3 35.0s

Top modele după Scor Specific domeniului

Scor Specific domeniului vs cost total

Top modele după Timp de răspuns (mediu)