AI BENCHY
तुलना करा
❤️ Made by XCS

मॉडेल नाव

Anthropic: Claude Sonnet 4.6

Aibenchy टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले : १९ फेब्रु, २०२६

मेट्रिक Anthropic: Claude Sonnet 4.6
क्रमांक#13
कंपनीAnthropic
Score 5.75
सुसंगतता 9.42
प्रति निकाल खर्च 0.9480
एकूण खर्च $0.05688
बरोबर चाचण्या 6/12
प्रति प्रयत्न पास दर 52.8%
अस्थिर चाचण्या 1
आउटपुट टोकन्स 1,659
रिझनिंग टोकन्स 0

श्रेणीवार तपशील

श्रेणी पूर्णपणे पास झालेल्या चाचण्या Score सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या तर्क गुण खर्च
Anti-AI Tricks 0/2 1.00 10.00 0.0% 0 - $0.01092
Data parsing and extraction 2/2 10.00 10.00 100.0% 0 - $0.02854
Domain specific 2/3 7.00 10.00 66.7% 0 - $0.00309
Instructions following 1/2 5.50 10.00 50.0% 0 - $0.00342
Puzzle Solving 1/3 5.00 7.68 44.4% 1 - $0.01092

तुलना केलेली मॉडेल्स

Anthropic: Claude Sonnet 4.6 ची तुलना याच्याशी करा...

#12 · OpenAI

OpenAI: gpt-oss-120b

तर्क (medium)

Score: 5.75

सुसंगतता: 7.19

प्रति प्रयत्न पास दर: 63.9%

अस्थिर चाचण्या: 4

प्रति निकाल खर्च: 0.0951

बरोबर चाचण्या: 6/12

एकूण खर्च: $0.00571

तुलना करा

#14 · Qwen

Qwen: Qwen3.5 Plus 2026-02-15

तर्क नाही

Score: 5.67

सुसंगतता: 9.99

प्रति प्रयत्न पास दर: 50.0%

अस्थिर चाचण्या: 0

प्रति निकाल खर्च: 0.0997

बरोबर चाचण्या: 6/12

एकूण खर्च: $0.00599

तुलना करा

#11 · OpenAI

OpenAI: GPT-5 Nano

तर्क (medium)

Score: 5.92

सुसंगतता: 6.03

प्रति प्रयत्न पास दर: 72.2%

अस्थिर चाचण्या: 6

प्रति निकाल खर्च: 0.4675

बरोबर चाचण्या: 6/12

एकूण खर्च: $0.02806

तुलना करा

झटपट तुलना

Anthropic: Claude Sonnet 4.6 ची तुलना याच्याशी करा...