AI BENCHY
موازنہ کریں چارٹس
❤️ Made by XCS
Your ad here

#9

Gemini 3.1 Flash Lite Preview

Google · اجرا: 2026-03-03 · google/gemini-3.1-flash-lite-preview::high

اوسط اسکور

7.77

فی نتیجہ لاگت

17.286

تسلسل

10.00

کل لاگت

$1.729

درست ٹیسٹس

10

کوئی ٹیسٹ تبھی مکمل کامیاب شمار ہوگا جب اس کے تمام رنز کامیاب ہوں

غلط ٹیسٹس

4

فی کوشش کامیابی کی شرح: 71.4%

غیر مستحکم ٹیسٹ

0

ردِعمل کا وقت: اوسط 58.25s · کل 815.54s · زیادہ سے زیادہ 136.53s

غلط جواب: 3 ہدایات پر عمل نہیں کیا: 1

اسکور کے لحاظ سے سرفہرست ماڈلز

پہلا ماڈل منتخب کریں، پھر دوسرا ماڈل کلک کریں تاکہ سائیڈ بائی سائیڈ صفحہ کھلے۔

فوری موازنہ

زمرہ وار تفصیل

زمرہ اوسط اسکور تسلسل درست ٹیسٹس
Anti-AI Tricks 10.00 10.00 3/3
Data parsing and extraction 9.88 10.00 2/2
Domain specific 4.00 10.00 1/3
Instructions following 8.00 9.97 1/2
Puzzle Solving 7.00 10.00 2/3
Tool Calling 10.00 10.00 1/1