???? ???
$0.320 / 1M
????? ???
$3.200 / 1M
अस्थिर चाचण्या
5
अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).
रन इतिहास
| चाचणी तारीख | स्कोअर | विश्वसनीयता | बरोबर चाचण्या | एकूण खर्च | तुलना करा |
|---|---|---|---|---|---|
| 2026-04-27 21:48 नवीन चाचणी जोडली | 7.0 | 10.0 | $0.209 | सध्याची रन | |
| 2026-04-27 21:31 पहिली नोंदलेली रन | 7.9 | 10.0 | $0.043 | तुलना करा |
या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.
चार्ट्स
पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.
स्कोअर vs एकूण खर्च
प्रतिसाद वेळ (सरासरी)
स्कोअर vs प्रतिसाद वेळ (सरासरी)
एकूण आउटपुट टोकन्स
स्कोअर vs एकूण आउटपुट टोकन्स
झटपट तुलना
Qwen3.6 27BmediumvsDeepSeek V3.2mediumQwen3.6 27BmediumvsClaude Sonnet 4.6noneQwen3.6 27BmediumvsGPT-5.2mediumQwen3.6 27BmediumvsMiMo-V2-OmnimediumQwen3.6 27BmediumvsQwen3.5-35B-A3BmediumQwen3.6 27BmediumvsGemini 3 Flash PreviewmediumQwen3.6 27BmediumvsGemini 3.1 Pro PreviewmediumQwen3.6 27BmediumvsRing 2.6 1tmediumमोफत उपलब्ध
श्रेणीवार तपशील
| श्रेणी | स्कोअर | सुसंगतता | बरोबर चाचण्या |
|---|---|---|---|
| अँटी-एआय युक्त्या | 8.3 | 10.0 | |
| कोडिंग | 10.0 | 10.0 | |
| संयुक्त | 7.0 | 3.7 | |
| डेटा पार्सिंग आणि निष्कर्षण | 3.5 | 1.4 | |
| डोमेन-विशिष्ट | 2.9 | 7.2 | |
| Samanya Buddhimatta | 6.5 | 3.4 | |
| सूचनांचे पालन | 10.0 | 10.0 | |
| कोडी सोडवणे | 7.7 | 10.0 | |
| टूल कॉलिंग | 10.0 | 10.0 | |
| सामान्य ज्ञान | 3.0 | 10.0 |