#9
Gemini 3.1 Flash Lite Preview
Google · اجرا: 2026-03-03 · google/gemini-3.1-flash-lite-preview::high
اوسط اسکور
7.77
فی نتیجہ لاگت
17.286
تسلسل
10.00
کل لاگت
$1.729
درست ٹیسٹس
10
کوئی ٹیسٹ تبھی مکمل کامیاب شمار ہوگا جب اس کے تمام رنز کامیاب ہوں
غلط ٹیسٹس
4
فی کوشش کامیابی کی شرح: 71.4%
غیر مستحکم ٹیسٹ
0
ردِعمل کا وقت: اوسط 58.25s · کل 815.54s · زیادہ سے زیادہ 136.53s
غلط جواب: 3
ہدایات پر عمل نہیں کیا: 1
اسکور کے لحاظ سے سرفہرست ماڈلز
پہلا ماڈل منتخب کریں، پھر دوسرا ماڈل کلک کریں تاکہ سائیڈ بائی سائیڈ صفحہ کھلے۔
فوری موازنہ
Gemini 3.1 Flash Lite PreviewhighvsGemini 3.1 Flash Lite PreviewlowGemini 3.1 Flash Lite PreviewhighvsGemini 3.1 Flash Lite PreviewnoneGemini 3.1 Flash Lite PreviewhighvsGPT-5.3-CodexmediumGemini 3.1 Flash Lite PreviewhighvsClaude Sonnet 4.6mediumGemini 3.1 Flash Lite PreviewhighvsGemini 3 Flash PreviewlowGemini 3.1 Flash Lite PreviewhighvsGPT-5.2 ChatnoneGemini 3.1 Flash Lite PreviewhighvsGemini 3 Flash PreviewmediumGemini 3.1 Flash Lite PreviewhighvsGemini 3.1 Pro PreviewmediumGemini 3.1 Flash Lite PreviewhighvsStep 3.5 Flashmediumمفت دستیاب
زمرہ وار تفصیل
| زمرہ | اوسط اسکور | تسلسل | درست ٹیسٹس |
|---|---|---|---|
| Anti-AI Tricks | 10.00 | 10.00 | 3/3 |
| Data parsing and extraction | 9.88 | 10.00 | 2/2 |
| Domain specific | 4.00 | 10.00 | 1/3 |
| Instructions following | 8.00 | 9.97 | 1/2 |
| Puzzle Solving | 7.00 | 10.00 | 2/3 |
| Tool Calling | 10.00 | 10.00 | 1/1 |