| अँटी-एआय युक्त्या | एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रीपीट पास होतात. अयशस्वी उत्तरे नाहीत. प्रतिसाद वेळ (सरासरी) 4687ms प्रतिसाद वेळ (कमाल) 6680ms प्रतिसाद वेळ (एकूण) 14061ms एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रीपीट पास होतात. क्रमांक: #6/29 ८२% Google: Gemini 3 Flash Preview - तर्क (medium) 100.0% Google: Gemini 3.1 Pro Preview - तर्क (medium) 100.0% Google: Gemini 3 Pro Preview - तर्क (medium) 100.0% Qwen: Qwen3.5 Plus 2026-02-15 - तर्क (medium) 100.0% Google: Gemini 3 Flash Preview - तर्क (low) 100.0% OpenAI: GPT-5.3-Codex - तर्क (medium) 100.0% MoonshotAI: Kimi K2.5 - तर्क नाही 0.0% 0.0% 100.0% | 10.00 सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण. क्रमांक: #6/29 ८२% Google: Gemini 3 Flash Preview - तर्क (medium) 10.00 Google: Gemini 3.1 Pro Preview - तर्क (medium) 10.00 Google: Gemini 3 Pro Preview - तर्क (medium) 10.00 Qwen: Qwen3.5 Plus 2026-02-15 - तर्क (medium) 10.00 Google: Gemini 3 Flash Preview - तर्क (low) 10.00 OpenAI: GPT-5.3-Codex - तर्क (medium) 10.00 Z.ai: GLM 4.7 Flash - तर्क नाही 1.00 1.00 10.00 | 10.00 सुसंगतता गुण रीपीट्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी). क्रमांक: #6/29 ८२% Google: Gemini 3 Flash Preview - तर्क (medium) 10.00 Google: Gemini 3.1 Pro Preview - तर्क (medium) 10.00 Google: Gemini 3 Pro Preview - तर्क (medium) 10.00 Qwen: Qwen3.5 Plus 2026-02-15 - तर्क (medium) 10.00 Google: Gemini 3 Flash Preview - तर्क (low) 10.00 OpenAI: GPT-5.3-Codex - तर्क (medium) 10.00 Anthropic: Claude Opus 4.6 - तर्क (medium) 4.41 4.41 10.00 | 100.0% प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रीपीटमधील एकूण प्रयत्न. क्रमांक: #6/29 ८२% Google: Gemini 3 Flash Preview - तर्क (medium) 100.0% Google: Gemini 3.1 Pro Preview - तर्क (medium) 100.0% Google: Gemini 3 Pro Preview - तर्क (medium) 100.0% Qwen: Qwen3.5 Plus 2026-02-15 - तर्क (medium) 100.0% Google: Gemini 3 Flash Preview - तर्क (low) 100.0% OpenAI: GPT-5.3-Codex - तर्क (medium) 100.0% xAI: Grok 4.1 Fast - तर्क नाही 0.0% 0.0% 100.0% | 0 अस्थिर चाचण्यांत रीपीट्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल). क्रमांक: #6/29 ८२% Google: Gemini 3 Flash Preview - तर्क (medium) ० Google: Gemini 3.1 Pro Preview - तर्क (medium) ० Google: Gemini 3 Pro Preview - तर्क (medium) ० Qwen: Qwen3.5 Plus 2026-02-15 - तर्क (medium) ० Google: Gemini 3 Flash Preview - तर्क (low) ० OpenAI: GPT-5.3-Codex - तर्क (medium) ० Anthropic: Claude Opus 4.6 - तर्क (medium) २ ० २ | 6.00 अंतिम उत्तर बरोबर आहे की नाही यापासून स्वतंत्रपणे तर्काची स्पष्टता, कार्यक्षमता आणि सुसंगती मोजते. क्रमांक: #15/19 २२% Anthropic: Claude Opus 4.6 - तर्क (medium) 10.00 OpenAI: gpt-oss-120b - तर्क (medium) 10.00 Anthropic: Claude Sonnet 4.6 - तर्क (medium) 9.89 Z.ai: GLM 5 - तर्क (medium) 9.83 StepFun: Step 3.5 Flash - तर्क (medium) 9.83 OpenAI: GPT-5.3-Codex - तर्क (medium) 6.00 Qwen: Qwen3 Coder Next - तर्क (medium) 4.00 4.00 10.00 | 4687ms | $0.02371 एकूण खर्च क्रमांक: #24/29 १८% StepFun: Step 3.5 Flash - तर्क (medium) $0.00000 OpenAI: GPT-4o-mini - तर्क नाही $0.00018 Z.ai: GLM 4.7 Flash - तर्क नाही $0.00020 Xiaomi: MiMo-V2-Flash - तर्क नाही $0.00024 xAI: Grok 4.1 Fast - तर्क नाही $0.00049 OpenAI: GPT-5.3-Codex - तर्क (medium) $0.02371 Anthropic: Claude Opus 4.6 - तर्क (medium) $0.05049 $0.00000 $0.05049 |
| डेटा पार्सिंग आणि निष्कर्षण | एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रीपीट पास होतात. अयशस्वी उत्तरे नाहीत. प्रतिसाद वेळ (सरासरी) 3180ms प्रतिसाद वेळ (कमाल) 3585ms प्रतिसाद वेळ (एकूण) 6360ms एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रीपीट पास होतात. क्रमांक: #6/29 ८२% Google: Gemini 3 Flash Preview - तर्क (medium) 100.0% Google: Gemini 3.1 Pro Preview - तर्क (medium) 100.0% Google: Gemini 3 Pro Preview - तर्क (medium) 100.0% Qwen: Qwen3.5 Plus 2026-02-15 - तर्क (medium) 100.0% Google: Gemini 3 Flash Preview - तर्क (low) 100.0% OpenAI: GPT-5.3-Codex - तर्क (medium) 100.0% Z.ai: GLM 4.7 Flash - तर्क नाही 0.0% 0.0% 100.0% | 10.00 सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण. क्रमांक: #6/29 ८२% Google: Gemini 3 Flash Preview - तर्क (medium) 10.00 Google: Gemini 3.1 Pro Preview - तर्क (medium) 10.00 Google: Gemini 3 Pro Preview - तर्क (medium) 10.00 Qwen: Qwen3.5 Plus 2026-02-15 - तर्क (medium) 10.00 Google: Gemini 3 Flash Preview - तर्क (low) 10.00 OpenAI: GPT-5.3-Codex - तर्क (medium) 10.00 Z.ai: GLM 4.7 Flash - तर्क नाही 0.50 0.50 10.00 | 10.00 सुसंगतता गुण रीपीट्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी). क्रमांक: #6/29 ८२% Google: Gemini 3 Flash Preview - तर्क (medium) 10.00 Google: Gemini 3.1 Pro Preview - तर्क (medium) 10.00 Google: Gemini 3 Pro Preview - तर्क (medium) 10.00 Qwen: Qwen3.5 Plus 2026-02-15 - तर्क (medium) 10.00 Google: Gemini 3 Flash Preview - तर्क (low) 10.00 OpenAI: GPT-5.3-Codex - तर्क (medium) 10.00 Z.ai: GLM 5 - तर्क (medium) 5.56 5.56 10.00 | 100.0% प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रीपीटमधील एकूण प्रयत्न. क्रमांक: #6/29 ८२% Google: Gemini 3 Flash Preview - तर्क (medium) 100.0% Google: Gemini 3.1 Pro Preview - तर्क (medium) 100.0% Google: Gemini 3 Pro Preview - तर्क (medium) 100.0% Qwen: Qwen3.5 Plus 2026-02-15 - तर्क (medium) 100.0% Google: Gemini 3 Flash Preview - तर्क (low) 100.0% OpenAI: GPT-5.3-Codex - तर्क (medium) 100.0% Xiaomi: MiMo-V2-Flash - तर्क नाही 16.7% 0.0% 100.0% | 0 अस्थिर चाचण्यांत रीपीट्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल). क्रमांक: #6/29 ८२% Google: Gemini 3 Flash Preview - तर्क (medium) ० Google: Gemini 3.1 Pro Preview - तर्क (medium) ० Google: Gemini 3 Pro Preview - तर्क (medium) ० Qwen: Qwen3.5 Plus 2026-02-15 - तर्क (medium) ० Google: Gemini 3 Flash Preview - तर्क (low) ० OpenAI: GPT-5.3-Codex - तर्क (medium) ० Z.ai: GLM 5 - तर्क (medium) १ ० १ | 1.25 अंतिम उत्तर बरोबर आहे की नाही यापासून स्वतंत्रपणे तर्काची स्पष्टता, कार्यक्षमता आणि सुसंगती मोजते. क्रमांक: #19/19 ०% OpenAI: gpt-oss-120b - तर्क (medium) 10.00 Z.ai: GLM 4.7 Flash - तर्क (medium) 9.87 Anthropic: Claude Sonnet 4.6 - तर्क (medium) 9.83 Anthropic: Claude Opus 4.6 - तर्क (medium) 9.83 Z.ai: GLM 5 - तर्क (medium) 9.80 OpenAI: GPT-5.3-Codex - तर्क (medium) 1.25 1.25 10.00 | 3180ms | $0.02600 एकूण खर्च क्रमांक: #23/29 २१% StepFun: Step 3.5 Flash - तर्क (medium) $0.00000 Xiaomi: MiMo-V2-Flash - तर्क (medium) $0.00029 Xiaomi: MiMo-V2-Flash - तर्क नाही $0.00029 Z.ai: GLM 4.7 Flash - तर्क नाही $0.00050 OpenAI: gpt-oss-120b - तर्क (medium) $0.00052 OpenAI: GPT-5.3-Codex - तर्क (medium) $0.02600 Anthropic: Claude Opus 4.6 - तर्क (medium) $0.07755 $0.00000 $0.07755 |
| डोमेन-विशिष्ट | एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रीपीट पास होतात. चुकीचे उत्तर: 2 प्रतिसाद वेळ (सरासरी) 64314ms प्रतिसाद वेळ (कमाल) 100927ms प्रतिसाद वेळ (एकूण) 192942ms एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रीपीट पास होतात. क्रमांक: #9/29 ७१% Google: Gemini 3 Flash Preview - तर्क (medium) 100.0% Google: Gemini 3.1 Pro Preview - तर्क (medium) 66.7% Google: Gemini 3 Flash Preview - तर्क नाही 66.7% Anthropic: Claude Sonnet 4.6 - तर्क नाही 66.7% Z.ai: GLM 4.7 Flash - तर्क नाही 66.7% OpenAI: GPT-5.3-Codex - तर्क (medium) 33.3% Anthropic: Claude Sonnet 4.6 - तर्क (medium) 0.0% 0.0% 100.0% | 4.00 सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण. क्रमांक: #9/29 ७१% Google: Gemini 3 Flash Preview - तर्क (medium) 10.00 Google: Gemini 3.1 Pro Preview - तर्क (medium) 7.00 Google: Gemini 3 Flash Preview - तर्क नाही 7.00 Anthropic: Claude Sonnet 4.6 - तर्क नाही 7.00 Z.ai: GLM 4.7 Flash - तर्क नाही 7.00 OpenAI: GPT-5.3-Codex - तर्क (medium) 4.00 Anthropic: Claude Sonnet 4.6 - तर्क (medium) 1.00 1.00 10.00 | 7.21 सुसंगतता गुण रीपीट्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी). क्रमांक: #15/29 ५०% Google: Gemini 3 Flash Preview - तर्क (medium) 10.00 Google: Gemini 3.1 Pro Preview - तर्क (medium) 10.00 Google: Gemini 3 Pro Preview - तर्क (medium) 10.00 Google: Gemini 3 Flash Preview - तर्क नाही 10.00 Anthropic: Claude Sonnet 4.6 - तर्क नाही 10.00 OpenAI: GPT-5.3-Codex - तर्क (medium) 7.21 Google: Gemini 3 Flash Preview - तर्क (low) 4.41 4.41 10.00 | 55.6% प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रीपीटमधील एकूण प्रयत्न. क्रमांक: #6/29 ८२% Google: Gemini 3 Flash Preview - तर्क (medium) 100.0% Google: Gemini 3.1 Pro Preview - तर्क (medium) 66.7% Google: Gemini 3 Flash Preview - तर्क नाही 66.7% Anthropic: Claude Sonnet 4.6 - तर्क नाही 66.7% Z.ai: GLM 4.7 Flash - तर्क नाही 66.7% OpenAI: GPT-5.3-Codex - तर्क (medium) 55.6% Z.ai: GLM 5 - तर्क नाही 0.0% 0.0% 100.0% | 1 अस्थिर चाचण्यांत रीपीट्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल). क्रमांक: #15/29 ५०% Google: Gemini 3 Flash Preview - तर्क (medium) ० Google: Gemini 3.1 Pro Preview - तर्क (medium) ० Google: Gemini 3 Pro Preview - तर्क (medium) ० Google: Gemini 3 Flash Preview - तर्क नाही ० Anthropic: Claude Sonnet 4.6 - तर्क नाही ० OpenAI: GPT-5.3-Codex - तर्क (medium) १ Google: Gemini 3 Flash Preview - तर्क (low) २ ० २ | 1.00 अंतिम उत्तर बरोबर आहे की नाही यापासून स्वतंत्रपणे तर्काची स्पष्टता, कार्यक्षमता आणि सुसंगती मोजते. क्रमांक: #19/19 ०% Xiaomi: MiMo-V2-Flash - तर्क (medium) 8.72 OpenAI: gpt-oss-120b - तर्क (medium) 8.53 StepFun: Step 3.5 Flash - तर्क (medium) 8.44 Z.ai: GLM 5 - तर्क (medium) 8.43 Z.ai: GLM 4.7 Flash - तर्क (medium) 8.21 OpenAI: GPT-5.3-Codex - तर्क (medium) 1.00 1.00 8.72 | 64314ms | $0.35664 एकूण खर्च क्रमांक: #27/29 ७% StepFun: Step 3.5 Flash - तर्क (medium) $0.00000 Z.ai: GLM 4.7 Flash - तर्क नाही $0.00005 Xiaomi: MiMo-V2-Flash - तर्क नाही $0.00008 Qwen: Qwen3 Coder Next - तर्क नाही $0.00010 Qwen: Qwen3 Coder Next - तर्क (medium) $0.00010 OpenAI: GPT-5.3-Codex - तर्क (medium) $0.35664 Anthropic: Claude Sonnet 4.6 - तर्क (medium) $0.64205 $0.00000 $0.64205 |
| सूचनांचे पालन | एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रीपीट पास होतात. सूचनांचे पालन केले नाही: 1 प्रतिसाद वेळ (सरासरी) 3037ms प्रतिसाद वेळ (कमाल) 3436ms प्रतिसाद वेळ (एकूण) 6074ms एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रीपीट पास होतात. क्रमांक: #15/29 ५०% Google: Gemini 3 Flash Preview - तर्क (medium) 100.0% Google: Gemini 3.1 Pro Preview - तर्क (medium) 100.0% Google: Gemini 3 Pro Preview - तर्क (medium) 100.0% Qwen: Qwen3.5 Plus 2026-02-15 - तर्क (medium) 100.0% OpenAI: GPT-5.2 - तर्क (medium) 100.0% OpenAI: GPT-5.3-Codex - तर्क (medium) 50.0% xAI: Grok 4.1 Fast - तर्क नाही 0.0% 0.0% 100.0% | 9.00 सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण. क्रमांक: #14/29 ५४% Google: Gemini 3 Flash Preview - तर्क (medium) 10.00 Google: Gemini 3.1 Pro Preview - तर्क (medium) 10.00 Anthropic: Claude Sonnet 4.6 - तर्क (medium) 10.00 Z.ai: GLM 5 - तर्क नाही 10.00 OpenAI: gpt-oss-120b - तर्क (medium) 10.00 OpenAI: GPT-5.3-Codex - तर्क (medium) 9.00 xAI: Grok 4.1 Fast - तर्क नाही 1.00 1.00 10.00 | 10.00 सुसंगतता गुण रीपीट्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी). क्रमांक: #4/29 ८९% Google: Gemini 3 Flash Preview - तर्क (medium) 10.00 Google: Gemini 3.1 Pro Preview - तर्क (medium) 10.00 Google: Gemini 3 Pro Preview - तर्क (medium) 10.00 OpenAI: GPT-5.3-Codex - तर्क (medium) 10.00 OpenAI: GPT-5.2 - तर्क (medium) 10.00 Xiaomi: MiMo-V2-Flash - तर्क (medium) 5.80 5.80 10.00 | 50.0% प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रीपीटमधील एकूण प्रयत्न. क्रमांक: #20/29 ३२% Google: Gemini 3 Flash Preview - तर्क (medium) 100.0% Google: Gemini 3.1 Pro Preview - तर्क (medium) 100.0% Google: Gemini 3 Pro Preview - तर्क (medium) 100.0% Qwen: Qwen3.5 Plus 2026-02-15 - तर्क (medium) 100.0% OpenAI: GPT-5.2 - तर्क (medium) 100.0% OpenAI: GPT-5.3-Codex - तर्क (medium) 50.0% xAI: Grok 4.1 Fast - तर्क नाही 0.0% 0.0% 100.0% | 0 अस्थिर चाचण्यांत रीपीट्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल). क्रमांक: #6/29 ८२% Google: Gemini 3 Flash Preview - तर्क (medium) ० Google: Gemini 3.1 Pro Preview - तर्क (medium) ० Google: Gemini 3 Pro Preview - तर्क (medium) ० Qwen: Qwen3.5 Plus 2026-02-15 - तर्क (medium) ० Google: Gemini 3 Flash Preview - तर्क (low) ० OpenAI: GPT-5.3-Codex - तर्क (medium) ० Google: Gemini 3 Flash Preview - तर्क नाही १ ० १ | 1.00 अंतिम उत्तर बरोबर आहे की नाही यापासून स्वतंत्रपणे तर्काची स्पष्टता, कार्यक्षमता आणि सुसंगती मोजते. क्रमांक: #19/19 ०% Anthropic: Claude Sonnet 4.6 - तर्क (medium) 10.00 Z.ai: GLM 5 - तर्क (medium) 9.75 StepFun: Step 3.5 Flash - तर्क (medium) 9.67 Anthropic: Claude Opus 4.6 - तर्क (medium) 9.50 OpenAI: gpt-oss-120b - तर्क (medium) 9.50 OpenAI: GPT-5.3-Codex - तर्क (medium) 1.00 1.00 10.00 | 3037ms | $0.01216 एकूण खर्च क्रमांक: #23/29 २१% StepFun: Step 3.5 Flash - तर्क (medium) $0.00000 Z.ai: GLM 4.7 Flash - तर्क नाही $0.00006 Xiaomi: MiMo-V2-Flash - तर्क नाही $0.00008 Qwen: Qwen3 Coder Next - तर्क नाही $0.00013 Qwen: Qwen3 Coder Next - तर्क (medium) $0.00014 OpenAI: GPT-5.3-Codex - तर्क (medium) $0.01216 Google: Gemini 3.1 Pro Preview - तर्क (medium) $0.03134 $0.00000 $0.03134 |
| Puzzle Solving | एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रीपीट पास होतात. सूचनांचे पालन केले नाही: 1 प्रतिसाद वेळ (सरासरी) 4610ms प्रतिसाद वेळ (कमाल) 7191ms प्रतिसाद वेळ (एकूण) 13830ms एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रीपीट पास होतात. क्रमांक: #8/29 ७५% Google: Gemini 3 Flash Preview - तर्क (medium) 100.0% Google: Gemini 3.1 Pro Preview - तर्क (medium) 100.0% Google: Gemini 3 Pro Preview - तर्क (medium) 100.0% Qwen: Qwen3.5 Plus 2026-02-15 - तर्क (medium) 100.0% Google: Gemini 3 Flash Preview - तर्क (low) 100.0% OpenAI: GPT-5.3-Codex - तर्क (medium) 66.7% StepFun: Step 3.5 Flash - तर्क (medium) 0.0% 0.0% 100.0% | 7.00 सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण. क्रमांक: #9/29 ७१% Google: Gemini 3.1 Pro Preview - तर्क (medium) 10.00 Google: Gemini 3 Pro Preview - तर्क (medium) 10.00 Qwen: Qwen3.5 Plus 2026-02-15 - तर्क (medium) 10.00 Google: Gemini 3 Flash Preview - तर्क (low) 10.00 Anthropic: Claude Sonnet 4.6 - तर्क (medium) 10.00 OpenAI: GPT-5.3-Codex - तर्क (medium) 7.00 Xiaomi: MiMo-V2-Flash - तर्क (medium) 1.00 1.00 10.00 | 7.38 सुसंगतता गुण रीपीट्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी). क्रमांक: #20/29 ३२% Google: Gemini 3 Flash Preview - तर्क (medium) 10.00 Google: Gemini 3.1 Pro Preview - तर्क (medium) 10.00 Google: Gemini 3 Pro Preview - तर्क (medium) 10.00 Qwen: Qwen3.5 Plus 2026-02-15 - तर्क (medium) 10.00 Google: Gemini 3 Flash Preview - तर्क (low) 10.00 OpenAI: GPT-5.3-Codex - तर्क (medium) 7.38 MiniMax: MiniMax M2.5 - तर्क (medium) 4.79 4.79 10.00 | 77.8% प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रीपीटमधील एकूण प्रयत्न. क्रमांक: #8/29 ७५% Google: Gemini 3 Flash Preview - तर्क (medium) 100.0% Google: Gemini 3.1 Pro Preview - तर्क (medium) 100.0% Google: Gemini 3 Pro Preview - तर्क (medium) 100.0% Qwen: Qwen3.5 Plus 2026-02-15 - तर्क (medium) 100.0% Google: Gemini 3 Flash Preview - तर्क (low) 100.0% OpenAI: GPT-5.3-Codex - तर्क (medium) 77.8% OpenAI: GPT-4o-mini - तर्क नाही 0.0% 0.0% 100.0% | 1 अस्थिर चाचण्यांत रीपीट्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल). क्रमांक: #18/29 ३९% Google: Gemini 3 Flash Preview - तर्क (medium) ० Google: Gemini 3.1 Pro Preview - तर्क (medium) ० Google: Gemini 3 Pro Preview - तर्क (medium) ० Qwen: Qwen3.5 Plus 2026-02-15 - तर्क (medium) ० Google: Gemini 3 Flash Preview - तर्क (low) ० OpenAI: GPT-5.3-Codex - तर्क (medium) १ OpenAI: GPT-5 Nano - तर्क (medium) २ ० २ | 6.00 अंतिम उत्तर बरोबर आहे की नाही यापासून स्वतंत्रपणे तर्काची स्पष्टता, कार्यक्षमता आणि सुसंगती मोजते. क्रमांक: #18/19 ६% Z.ai: GLM 5 - तर्क (medium) 9.50 Anthropic: Claude Sonnet 4.6 - तर्क (medium) 9.44 Anthropic: Claude Opus 4.6 - तर्क (medium) 9.44 MoonshotAI: Kimi K2.5 - तर्क (medium) 9.26 StepFun: Step 3.5 Flash - तर्क (medium) 9.22 OpenAI: GPT-5.3-Codex - तर्क (medium) 6.00 Qwen: Qwen3 Coder Next - तर्क (medium) 4.33 4.33 9.50 | 4610ms | $0.02559 एकूण खर्च क्रमांक: #25/29 १४% StepFun: Step 3.5 Flash - तर्क (medium) $0.00000 Z.ai: GLM 4.7 Flash - तर्क नाही $0.00008 OpenAI: GPT-4o-mini - तर्क नाही $0.00028 xAI: Grok 4.1 Fast - तर्क नाही $0.00053 Qwen: Qwen3 Coder Next - तर्क (medium) $0.00058 OpenAI: GPT-5.3-Codex - तर्क (medium) $0.02559 Qwen: Qwen3.5 Plus 2026-02-15 - तर्क (medium) $0.05508 $0.00000 $0.05508 |