AI BENCHY तुलना
OpenAI: GPT-5.2 vs OpenAI: GPT-5.5
बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-22
| मेट्रिक | GPT-5.2 GPT-5.2 medium | GPT-5.5 GPT-5.5 none |
|---|---|---|
| स्कोर | 7.4 | 6.5 |
| रैंक | #57 | #86 |
| विश्वसनीयता | 10.0 | 10.0 |
| संगति | 8.3 | 8.7 |
| सही परीक्षण | ||
| प्रति प्रयास पास दर | 70.0% | 56.7% |
| अस्थिर टेस्ट | 4 | 3 |
| कुल रन | 60 | 60 |
| प्रति परिणाम लागत | 4.081 | 2.165 |
| कुल लागत | $0.490 | $0.217 |
| ???? ??? | $1.750 / 1M | $5.000 / 1M |
| ????? ??? | $14.000 / 1M | $30.000 / 1M |
| आउटपुट टोकन | 2,754 | 1,949 |
| रीजनिंग टोकन | 28,303 | 0 |
| प्रतिक्रिया समय (औसत) | 16.44s | 1.94s |
| प्रतिक्रिया समय (अधिकतम) | 77.80s | 5.56s |
| प्रतिक्रिया समय (कुल) | 213.77s | 38.86s |
स्कोर बनाम कुल लागत
प्रतिक्रिया समय (औसत)
स्कोर vs प्रतिक्रिया समय (औसत)
कुल आउटपुट टोकन
स्कोर vs कुल आउटपुट टोकन
श्रेणी विवरण
त्वरित तुलना
तुलना जोड़ी बदलें
DeepSeek V4 Flashhighनिःशुल्क उपलब्धvsGPT-5.2mediumGPT-5.5nonevsQwen3.6 27BmediumGemini 3.1 Flash LitelowvsGPT-5.2mediumGemini 3.1 Flash Lite PreviewnonevsGPT-5.2mediumDeepSeek V4 ProhighvsGPT-5.5noneKimi K2.5mediumvsGPT-5.5noneGemini 3.1 Flash LiteminimalvsGPT-5.5noneRing-2.6-1TnonevsGPT-5.2mediumGPT-5.5nonevsGrok 4.20mediumGemini 3.1 Flash Lite PreviewlowvsGPT-5.2mediumGemini 3 Flash PreviewnonevsGPT-5.2mediumGPT-5.2mediumvsQwen3.6 Max Previewnone