#10
Gemini 3.1 Flash Lite Preview
Google · اجرا: 2026-03-03 · google/gemini-3.1-flash-lite-preview::none
اوسط اسکور
7.70
فی نتیجہ لاگت
0.116
تسلسل
9.54
کل لاگت
$0.011
درست ٹیسٹس
9
کوئی ٹیسٹ تبھی مکمل کامیاب شمار ہوگا جب اس کے تمام رنز کامیاب ہوں
غلط ٹیسٹس
5
فی کوشش کامیابی کی شرح: 69.1%
غیر مستحکم ٹیسٹ
1
ردِعمل کا وقت: اوسط 1.24s · کل 17.33s · زیادہ سے زیادہ 3.39s
غلط جواب: 3
ہدایات پر عمل نہیں کیا: 2
اسکور کے لحاظ سے سرفہرست ماڈلز
پہلا ماڈل منتخب کریں، پھر دوسرا ماڈل کلک کریں تاکہ سائیڈ بائی سائیڈ صفحہ کھلے۔
فوری موازنہ
Gemini 3.1 Flash Lite PreviewnonevsGemini 3.1 Flash Lite PreviewhighGemini 3.1 Flash Lite PreviewnonevsClaude Sonnet 4.6mediumGemini 3.1 Flash Lite PreviewnonevsGemini 3.1 Flash Lite PreviewlowGemini 3.1 Flash Lite PreviewnonevsGPT-5.2 ChatnoneGemini 3.1 Flash Lite PreviewnonevsGPT-5.3-CodexmediumGemini 3.1 Flash Lite PreviewnonevsGLM 5mediumGemini 3.1 Flash Lite PreviewnonevsGemini 3 Flash PreviewmediumGemini 3.1 Flash Lite PreviewnonevsGemini 3.1 Pro PreviewmediumGemini 3.1 Flash Lite PreviewnonevsStep 3.5 Flashmediumمفت دستیاب
زمرہ وار تفصیل
| زمرہ | اوسط اسکور | تسلسل | درست ٹیسٹس |
|---|---|---|---|
| Anti-AI Tricks | 6.00 | 7.85 | 1/3 |
| Data parsing and extraction | 9.88 | 10.00 | 2/2 |
| Domain specific | 4.00 | 10.00 | 1/3 |
| Instructions following | 9.00 | 10.00 | 1/2 |
| Puzzle Solving | 10.00 | 10.00 | 3/3 |
| Tool Calling | 10.00 | 10.00 | 1/1 |