Navigation
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Owl Alpha vs Laguna M.1

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-04-30

Métrique Owl Alpha Owl Alpha none Sortie: 2026-04-30 Laguna M.1 Laguna M.1 medium Sortie: 2026-04-28 Disponible gratuitement
Score 6.0 6.3
Rang #87 #75
Fiabilité 10.0 10.0
Cohérence 9.1 8.6
Tests corrects
Taux de réussite par tentative 46.3% 53.7%
Tests instables 2 3
Exécutions totales 54 54
Coût par résultat 0.000 0.000
Coût total $0.000 $0.000
Prix d'entrée $0.000 / 1M $0.000 / 1M
Prix de sortie $0.000 / 1M $0.000 / 1M
Jetons de sortie 1,671 63,822
Jetons de raisonnement 0 0
Temps de réponse (moy.) 7.07s 13.90s
Temps de réponse (max) 32.27s 53.14s
Temps de réponse (total) 127.23s 250.28s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Owl Alpha 3.4 7.9 16.7% 1 2.78s 57 0
Laguna M.1 6.6 10.0 50.0% 0 9.15s 7,839 0
Programmation Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Owl Alpha 10.0 10.0 100.0% 0 32.27s 450 0
Laguna M.1 4.3 1.1 66.7% 1 35.61s 14,327 0
Combiné Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Owl Alpha 3.0 10.0 0.0% 0 21.74s 315 0
Laguna M.1 3.0 10.0 0.0% 0 53.14s 12,272 0
Analyse et extraction des données Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Owl Alpha 10.0 10.0 100.0% 0 3.60s 246 0
Laguna M.1 10.0 10.0 100.0% 0 4.93s 2,296 0
Spécifique au domaine Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Owl Alpha 5.3 10.0 33.3% 0 3.00s 27 0
Laguna M.1 5.3 7.2 44.4% 1 24.14s 19,020 0
Intelligence générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Owl Alpha 4.3 10.0 0.0% 0 4.61s 80 0
Laguna M.1 4.1 10.0 0.0% 0 6.86s 1,294 0
Suivi des instructions Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Owl Alpha 6.4 10.0 50.0% 0 2.63s 63 0
Laguna M.1 10.0 10.0 100.0% 0 4.30s 1,626 0
Résolution d'énigmes Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Owl Alpha 5.9 7.2 55.6% 1 4.43s 202 0
Laguna M.1 3.6 7.2 22.2% 1 6.97s 3,978 0
Appel d'outils Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Owl Alpha 10.0 10.0 100.0% 0 22.78s 231 0
Laguna M.1 10.0 10.0 100.0% 0 6.31s 1,170 0

Comparaison rapide

Changer la paire de comparaison