AI BENCHY Compare
OpenAI: GPT-5.2 vs xAI: Grok 4.20
AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-10
| मेट्रिक | GPT-5.2 GPT-5.2 medium | Grok 4.20 Grok 4.20 medium |
|---|---|---|
| स्कोअर | 7.2 | 6.9 |
| क्रमांक | #60 | #68 |
| विश्वसनीयता | 10.0 | 10.0 |
| सुसंगतता | 8.2 | 8.3 |
| बरोबर चाचण्या | ||
| प्रति प्रयत्न पास दर | 68.4% | 63.2% |
| अस्थिर चाचण्या | 4 | 4 |
| एकूण रन | 57 | 57 |
| प्रति निकाल खर्च | 3.609 | 7.559 |
| एकूण खर्च | $0.397 | $0.756 |
| ???? ??? | $1.750 / 1M | $1.250 / 1M |
| ????? ??? | $14.000 / 1M | $2.500 / 1M |
| आउटपुट टोकन्स | 2,731 | 1,784 |
| रिझनिंग टोकन्स | 22,200 | 128,233 |
| प्रतिसाद वेळ (सरासरी) | 15.22s | 14.53s |
| प्रतिसाद वेळ (कमाल) | 77.80s | 63.48s |
| प्रतिसाद वेळ (एकूण) | 182.59s | 276.06s |
स्कोअर विरुद्ध एकूण खर्च
प्रतिसाद वेळ (सरासरी)
स्कोअर vs प्रतिसाद वेळ (सरासरी)
एकूण आउटपुट टोकन्स
स्कोअर vs एकूण आउटपुट टोकन्स
श्रेणीवार तपशील
झटपट तुलना
तुलना जोडी बदला
DeepSeek V4 ProhighvsGrok 4.20mediumGemma 4 31Bnoneमोफत उपलब्धvsGrok 4.20mediumClaude Sonnet 4.6nonevsGPT-5.2mediumRing 2.6 1tnoneमोफत उपलब्धvsGPT-5.2mediumGemini 3.1 Flash LiteminimalvsGrok 4.20mediumGPT-5.2mediumvsQwen3.6 Max PreviewnoneGPT-5.5nonevsGrok 4.20mediumGemini 3.1 Flash LitenonevsGrok 4.20mediumQwen3.5 Plus 2026-02-15nonevsGrok 4.20mediumClaude Sonnet 4.6nonevsGrok 4.20mediumGemma 4 31Bnoneमोफत उपलब्धvsGPT-5.2mediumDeepSeek V4 FlashhighvsGPT-5.2medium