AI BENCHY Categorie
Toolaanroepen-ranglijst
Zie welke AI-modellen het best presteren op Toolaanroepen, welke betrouwbaar blijven en waar de grootste verschillen zitten. Sorteren op: Responstijd (gem.) โ.
169/169
Modellen filteren
Geen modellen komen overeen met de huidige zoekopdracht en filters.
| Rang | Model | Bedrijf | Toolaanroepen-score | Score | Totale kosten | Correcte tests | Responstijd (gem.) |
|---|---|---|---|---|---|---|---|
| #117 | DeepSeek V4 Flash none | DeepSeek | 10.0 | 5.5 | $0.007 | 1/1 | 77.9s |
| #74 | Hy3 preview high | Tencent | 10.0 | 6.8 | $0.059 | 1/1 | 78.8s |
| #50 | Seed-2.0-Mini medium | Bytedance Seed | 10.0 | 7.4 | $0.044 | 1/1 | 88.7s |
| #72 | Ring-2.6-1T medium | Inclusionai | 10.0 | 6.8 | $0.033 | 1/1 | 104.4s |