AI BENCHY
Advertise here

Categorie AI BENCHY

Clasament Specific domeniului

Vezi ce modele AI se descurcă cel mai bine la Specific domeniului, care rămân fiabile și unde apar cele mai mari diferențe. Sortează după: Teste corecte ↑.

Modele afișate

15

Media pentru Scor Specific domeniului

4.8

Cel mai bun model

Qwen3.6 Max Preview 2.9
Rang Model Companie Scor Specific domeniului Scor Teste corecte Timp de răspuns (mediu)
#53 Gemini 3.1 Flash Lite high Google 3.6 7.3 0/3 139.9s
#54 GPT-5 Mini medium OpenAI 3.6 7.3 0/3 44.6s
#63 GPT-5.3 Chat none OpenAI 3.5 7.2 0/3 13.0s
#66 Qwen3.5-35B-A3B medium Qwen 4.1 7.1 0/3 88.3s
#69 Claude Opus 4.6 medium Anthropic 3.0 7.0 0/3 83.4s
#71 Step 3.7 Flash high Stepfun 4.1 7.0 0/3 149.6s
#72 DeepSeek V3.2 medium DeepSeek 2.9 7.0 0/3 24.3s
#73 Seed-2.0-Mini medium Bytedance Seed 3.0 6.9 0/3 0ms
#75 Ring-2.6-1T medium Inclusionai 3.5 6.9 0/3 64.9s
#76 Kimi K2.5 medium Moonshot AI 3.5 6.8 0/3 137.3s
#78 Qwen3.6 27B medium Qwen 2.9 6.8 0/3 73.4s
#79 Hunter Alpha medium OpenRouter 3.0 6.7 0/3 10.5s
#80 Mimo V2 Omni medium Xiaomi 3.0 6.7 0/3 47.9s
#81 Mercury 2 medium Inception 2.9 6.6 0/3 6.48s
#84 Grok 4.20 Multi Agent Beta medium X AI 2.9 6.6 0/3 24.7s

Top modele după Scor Specific domeniului

Scor Specific domeniului vs cost total

Top modele după Timp de răspuns (mediu)