AI BENCHY
Comparar Gráficos
❤️ Made by XCS
Your ad here

#18

Seed-2.0-Mini

Bytedance Seed · bytedance-seed/seed-2.0-mini::medium

Puntaje prom.

6.13

Costo por resultado

0.177

Consistencia

8.91

Costo total

$0.013

Pruebas correctas

7

Una prueba cuenta como totalmente superada solo si todas sus ejecuciones pasan.

Pruebas incorrectas

7

Tasa de aciertos por intento: 59.5%

Pruebas inestables

2

Tiempo de respuesta: promedio 51.69s · total 568.63s · máximo 182.10s

Tiempo agotado: 4 No siguió las instrucciones: 2 Respuesta incorrecta: 1

Mejores modelos por puntuación

Elige el primer modelo y luego haz clic en un segundo modelo para abrir una página lado a lado.

Comparación rápida

Desglose por categoría

Categoría Puntaje prom. Consistencia Pruebas correctas
Anti-AI Tricks 7.00 10.00 2/3
Data parsing and extraction 9.88 10.00 2/2
Domain specific 1.00 10.00 0/3
Instructions following 8.00 9.99 1/2
Puzzle Solving 5.34 4.91 1/3
Tool Calling 10.00 10.00 1/1