AI BENCHY
Comparer Graphiques
❤️ Made by XCS
Your ad here

#20

Gemini 3.1 Flash Lite Preview

Google · Sortie: 2026-03-03 · google/gemini-3.1-flash-lite-preview::medium

Score moy.

6.92

Coût par résultat

0.392

Cohérence

10.00

Coût total

$0.032

Tests corrects

8

Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.

Tests incorrects

6

Taux de réussite par tentative: 57.1%

Tests instables

0

Temps de réponse : moy. 3.08s · total 43.17s · max 5.86s

Mauvaise réponse: 4 N'a pas suivi les instructions: 2

Meilleurs modèles par score

Choisissez d'abord le premier modèle, puis cliquez sur un second modèle pour ouvrir une page côte à côte.

Comparaison rapide

Répartition par catégorie

Catégorie Score moy. Cohérence Tests corrects
Anti-AI Tricks 9.00 10.00 2/3
Data parsing and extraction 9.88 10.00 2/2
Domain specific 1.00 10.00 0/3
Instructions following 8.00 9.99 1/2
Puzzle Solving 7.00 10.00 2/3
Tool Calling 10.00 10.00 1/1