AI BENCHY Compare
Anthropic: Claude Sonnet 4.6 vs Google: Gemini 3.1 Flash Lite Preview
موازنہ کریں:
بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-03-03
| میٹرک | Anthropic: Claude Sonnet 4.6 medium اجرا: 2026-02-17 | Google: Gemini 3.1 Flash Lite Preview high اجرا: 2026-03-03 |
|---|---|---|
| درجہ | #11 | #9 |
| اوسط اسکور | 7.43 | 7.77 |
| تسلسل | 9.40 | 9.99 |
| فی نتیجہ لاگت | 8.105 | 17.286 |
| کل لاگت | $0.811 | $1.729 |
| درست ٹیسٹس | ||
| فی کوشش کامیابی کی شرح | 73.8% | 71.4% |
| غیر مستحکم ٹیسٹ | 1 | 0 |
| آؤٹ پٹ ٹوکنز | 29,098 | 831 |
| ریزننگ ٹوکنز | 20,435 | 1,148,955 |
اسکور بمقابلہ کل لاگت
زمرہ وار تفصیل
| اینٹی اے آئی چالیں | اسکور | تسلسل | فی کوشش کامیابی کی شرح | غیر مستحکم ٹیسٹ | درست ٹیسٹس | آؤٹ پٹ ٹوکنز | ریزننگ ٹوکنز |
|---|---|---|---|---|---|---|---|
| Anthropic: Claude Sonnet 4.6 | 7.00 | 10.00 | 66.7% | 0 | 1,031 | 1,093 | |
| Google: Gemini 3.1 Flash Lite Preview | 10.00 | 10.00 | 100.0% | 0 | 144 | 193,077 |
| ڈیٹا پارسنگ اور استخراج | اسکور | تسلسل | فی کوشش کامیابی کی شرح | غیر مستحکم ٹیسٹ | درست ٹیسٹس | آؤٹ پٹ ٹوکنز | ریزننگ ٹوکنز |
|---|---|---|---|---|---|---|---|
| Anthropic: Claude Sonnet 4.6 | 10.00 | 10.00 | 100.0% | 0 | 727 | 907 | |
| Google: Gemini 3.1 Flash Lite Preview | 9.88 | 10.00 | 100.0% | 0 | 279 | 6,186 |
| ڈومین مخصوص | اسکور | تسلسل | فی کوشش کامیابی کی شرح | غیر مستحکم ٹیسٹ | درست ٹیسٹس | آؤٹ پٹ ٹوکنز | ریزننگ ٹوکنز |
|---|---|---|---|---|---|---|---|
| Anthropic: Claude Sonnet 4.6 | 1.00 | 7.21 | 11.1% | 1 | 25,790 | 16,919 | |
| Google: Gemini 3.1 Flash Lite Preview | 4.00 | 10.00 | 33.3% | 0 | 18 | 566,202 |
| ہدایات کی پیروی | اسکور | تسلسل | فی کوشش کامیابی کی شرح | غیر مستحکم ٹیسٹ | درست ٹیسٹس | آؤٹ پٹ ٹوکنز | ریزننگ ٹوکنز |
|---|---|---|---|---|---|---|---|
| Anthropic: Claude Sonnet 4.6 | 10.00 | 10.00 | 100.0% | 0 | 316 | 523 | |
| Google: Gemini 3.1 Flash Lite Preview | 8.00 | 9.96 | 50.0% | 0 | 69 | 190,053 |
| Puzzle Solving | اسکور | تسلسل | فی کوشش کامیابی کی شرح | غیر مستحکم ٹیسٹ | درست ٹیسٹس | آؤٹ پٹ ٹوکنز | ریزننگ ٹوکنز |
|---|---|---|---|---|---|---|---|
| Anthropic: Claude Sonnet 4.6 | 10.00 | 10.00 | 100.0% | 0 | 579 | 642 | |
| Google: Gemini 3.1 Flash Lite Preview | 7.00 | 10.00 | 66.7% | 0 | 87 | 190,953 |
| ٹول کالنگ | اسکور | تسلسل | فی کوشش کامیابی کی شرح | غیر مستحکم ٹیسٹ | درست ٹیسٹس | آؤٹ پٹ ٹوکنز | ریزننگ ٹوکنز |
|---|---|---|---|---|---|---|---|
| Anthropic: Claude Sonnet 4.6 | 10.00 | 10.00 | 100.0% | 0 | 655 | 351 | |
| Google: Gemini 3.1 Flash Lite Preview | 10.00 | 10.00 | 100.0% | 0 | 234 | 2,484 |
فوری موازنہ
موازنہ کی جوڑی تبدیل کریں
Claude Sonnet 4.6mediumvsGPT-5.2 ChatnoneGemini 3.1 Flash Lite PreviewhighvsGPT-5.3-CodexmediumClaude Sonnet 4.6mediumvsGPT-5.3 ChatnoneClaude Sonnet 4.6mediumvsGemini 3 Flash PreviewnoneClaude Sonnet 4.6mediumvsGemini 3.1 Flash Lite PreviewnoneGemini 3.1 Flash Lite PreviewhighvsGPT-5.2 ChatnoneClaude Sonnet 4.6mediumvsGemini 3.1 Flash Lite PreviewlowGemini 3.1 Flash Lite PreviewhighvsGLM 5mediumGemini 3.1 Flash Lite PreviewhighvsGPT-5.3 ChatnoneGemini 3.1 Flash Lite PreviewhighvsStep 3.5 Flashmediumمفت دستیابGemini 3.1 Flash Lite PreviewhighvsQwen3.5-27BmediumDeepSeek V3.2mediumvsGemini 3.1 Flash Lite Previewhigh