| अँटी-एआय युक्त्या | एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रीपीट पास होतात. अयशस्वी उत्तरे नाहीत. प्रतिसाद वेळ (सरासरी) 3496ms प्रतिसाद वेळ (कमाल) 4305ms प्रतिसाद वेळ (एकूण) 10487ms एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रीपीट पास होतात. क्रमांक: #5/29 ८६% Google: Gemini 3 Flash Preview - तर्क (medium) 100.0% Google: Gemini 3.1 Pro Preview - तर्क (medium) 100.0% Google: Gemini 3 Pro Preview - तर्क (medium) 100.0% Qwen: Qwen3.5 Plus 2026-02-15 - तर्क (medium) 100.0% Google: Gemini 3 Flash Preview - तर्क (low) 100.0% MoonshotAI: Kimi K2.5 - तर्क नाही 0.0% 0.0% 100.0% | 10.00 सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण. क्रमांक: #5/29 ८६% Google: Gemini 3 Flash Preview - तर्क (medium) 10.00 Google: Gemini 3.1 Pro Preview - तर्क (medium) 10.00 Google: Gemini 3 Pro Preview - तर्क (medium) 10.00 Qwen: Qwen3.5 Plus 2026-02-15 - तर्क (medium) 10.00 Google: Gemini 3 Flash Preview - तर्क (low) 10.00 Z.ai: GLM 4.7 Flash - तर्क नाही 1.00 1.00 10.00 | 10.00 सुसंगतता गुण रीपीट्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी). क्रमांक: #5/29 ८६% Google: Gemini 3 Flash Preview - तर्क (medium) 10.00 Google: Gemini 3.1 Pro Preview - तर्क (medium) 10.00 Google: Gemini 3 Pro Preview - तर्क (medium) 10.00 Qwen: Qwen3.5 Plus 2026-02-15 - तर्क (medium) 10.00 Google: Gemini 3 Flash Preview - तर्क (low) 10.00 Anthropic: Claude Opus 4.6 - तर्क (medium) 4.41 4.41 10.00 | 100.0% प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रीपीटमधील एकूण प्रयत्न. क्रमांक: #5/29 ८६% Google: Gemini 3 Flash Preview - तर्क (medium) 100.0% Google: Gemini 3.1 Pro Preview - तर्क (medium) 100.0% Google: Gemini 3 Pro Preview - तर्क (medium) 100.0% Qwen: Qwen3.5 Plus 2026-02-15 - तर्क (medium) 100.0% Google: Gemini 3 Flash Preview - तर्क (low) 100.0% xAI: Grok 4.1 Fast - तर्क नाही 0.0% 0.0% 100.0% | 0 अस्थिर चाचण्यांत रीपीट्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल). क्रमांक: #5/29 ८६% Google: Gemini 3 Flash Preview - तर्क (medium) ० Google: Gemini 3.1 Pro Preview - तर्क (medium) ० Google: Gemini 3 Pro Preview - तर्क (medium) ० Qwen: Qwen3.5 Plus 2026-02-15 - तर्क (medium) ० Google: Gemini 3 Flash Preview - तर्क (low) ० Anthropic: Claude Opus 4.6 - तर्क (medium) २ ० २ | 6.23 अंतिम उत्तर बरोबर आहे की नाही यापासून स्वतंत्रपणे तर्काची स्पष्टता, कार्यक्षमता आणि सुसंगती मोजते. टीप: काही Gemini मॉडेल्समध्ये फक्त अंशतः reasoning मजकूर उपलब्ध असतो, त्यामुळे reasoning स्कोअर कमी दिसू शकतो. क्रमांक: #14/19 २८% Anthropic: Claude Opus 4.6 - तर्क (medium) 10.00 OpenAI: gpt-oss-120b - तर्क (medium) 10.00 Anthropic: Claude Sonnet 4.6 - तर्क (medium) 9.89 Z.ai: GLM 5 - तर्क (medium) 9.83 StepFun: Step 3.5 Flash - तर्क (medium) 9.83 Google: Gemini 3 Flash Preview - तर्क (low) 6.23 Qwen: Qwen3 Coder Next - तर्क (medium) 4.00 4.00 10.00 | 3496ms | $0.00844 एकूण खर्च क्रमांक: #16/29 ४६% StepFun: Step 3.5 Flash - तर्क (medium) $0.00000 OpenAI: GPT-4o-mini - तर्क नाही $0.00018 Z.ai: GLM 4.7 Flash - तर्क नाही $0.00020 Xiaomi: MiMo-V2-Flash - तर्क नाही $0.00024 xAI: Grok 4.1 Fast - तर्क नाही $0.00049 Google: Gemini 3 Flash Preview - तर्क (low) $0.00844 Anthropic: Claude Opus 4.6 - तर्क (medium) $0.05049 $0.00000 $0.05049 |
| डेटा पार्सिंग आणि निष्कर्षण | एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रीपीट पास होतात. अयशस्वी उत्तरे नाहीत. प्रतिसाद वेळ (सरासरी) 9460ms प्रतिसाद वेळ (कमाल) 14717ms प्रतिसाद वेळ (एकूण) 18919ms एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रीपीट पास होतात. क्रमांक: #5/29 ८६% Google: Gemini 3 Flash Preview - तर्क (medium) 100.0% Google: Gemini 3.1 Pro Preview - तर्क (medium) 100.0% Google: Gemini 3 Pro Preview - तर्क (medium) 100.0% Qwen: Qwen3.5 Plus 2026-02-15 - तर्क (medium) 100.0% Google: Gemini 3 Flash Preview - तर्क (low) 100.0% Z.ai: GLM 4.7 Flash - तर्क नाही 0.0% 0.0% 100.0% | 10.00 सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण. क्रमांक: #5/29 ८६% Google: Gemini 3 Flash Preview - तर्क (medium) 10.00 Google: Gemini 3.1 Pro Preview - तर्क (medium) 10.00 Google: Gemini 3 Pro Preview - तर्क (medium) 10.00 Qwen: Qwen3.5 Plus 2026-02-15 - तर्क (medium) 10.00 Google: Gemini 3 Flash Preview - तर्क (low) 10.00 Z.ai: GLM 4.7 Flash - तर्क नाही 0.50 0.50 10.00 | 10.00 सुसंगतता गुण रीपीट्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी). क्रमांक: #5/29 ८६% Google: Gemini 3 Flash Preview - तर्क (medium) 10.00 Google: Gemini 3.1 Pro Preview - तर्क (medium) 10.00 Google: Gemini 3 Pro Preview - तर्क (medium) 10.00 Qwen: Qwen3.5 Plus 2026-02-15 - तर्क (medium) 10.00 Google: Gemini 3 Flash Preview - तर्क (low) 10.00 Z.ai: GLM 5 - तर्क (medium) 5.56 5.56 10.00 | 100.0% प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रीपीटमधील एकूण प्रयत्न. क्रमांक: #5/29 ८६% Google: Gemini 3 Flash Preview - तर्क (medium) 100.0% Google: Gemini 3.1 Pro Preview - तर्क (medium) 100.0% Google: Gemini 3 Pro Preview - तर्क (medium) 100.0% Qwen: Qwen3.5 Plus 2026-02-15 - तर्क (medium) 100.0% Google: Gemini 3 Flash Preview - तर्क (low) 100.0% Xiaomi: MiMo-V2-Flash - तर्क नाही 16.7% 0.0% 100.0% | 0 अस्थिर चाचण्यांत रीपीट्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल). क्रमांक: #5/29 ८६% Google: Gemini 3 Flash Preview - तर्क (medium) ० Google: Gemini 3.1 Pro Preview - तर्क (medium) ० Google: Gemini 3 Pro Preview - तर्क (medium) ० Qwen: Qwen3.5 Plus 2026-02-15 - तर्क (medium) ० Google: Gemini 3 Flash Preview - तर्क (low) ० Z.ai: GLM 5 - तर्क (medium) १ ० १ | 4.73 अंतिम उत्तर बरोबर आहे की नाही यापासून स्वतंत्रपणे तर्काची स्पष्टता, कार्यक्षमता आणि सुसंगती मोजते. टीप: काही Gemini मॉडेल्समध्ये फक्त अंशतः reasoning मजकूर उपलब्ध असतो, त्यामुळे reasoning स्कोअर कमी दिसू शकतो. क्रमांक: #17/19 ११% OpenAI: gpt-oss-120b - तर्क (medium) 10.00 Z.ai: GLM 4.7 Flash - तर्क (medium) 9.87 Anthropic: Claude Sonnet 4.6 - तर्क (medium) 9.83 Anthropic: Claude Opus 4.6 - तर्क (medium) 9.83 Z.ai: GLM 5 - तर्क (medium) 9.80 Google: Gemini 3 Flash Preview - तर्क (low) 4.73 OpenAI: GPT-5.3-Codex - तर्क (medium) 1.25 1.25 10.00 | 9460ms | $0.01354 एकूण खर्च क्रमांक: #18/29 ३९% StepFun: Step 3.5 Flash - तर्क (medium) $0.00000 Xiaomi: MiMo-V2-Flash - तर्क (medium) $0.00029 Xiaomi: MiMo-V2-Flash - तर्क नाही $0.00029 Z.ai: GLM 4.7 Flash - तर्क नाही $0.00050 OpenAI: gpt-oss-120b - तर्क (medium) $0.00052 Google: Gemini 3 Flash Preview - तर्क (low) $0.01354 Anthropic: Claude Opus 4.6 - तर्क (medium) $0.07755 $0.00000 $0.07755 |
| डोमेन-विशिष्ट | एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रीपीट पास होतात. चुकीचे उत्तर: 2 प्रतिसाद वेळ (सरासरी) 8314ms प्रतिसाद वेळ (कमाल) 14399ms प्रतिसाद वेळ (एकूण) 24941ms एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रीपीट पास होतात. क्रमांक: #8/29 ७५% Google: Gemini 3 Flash Preview - तर्क (medium) 100.0% Google: Gemini 3.1 Pro Preview - तर्क (medium) 66.7% Google: Gemini 3 Flash Preview - तर्क नाही 66.7% Anthropic: Claude Sonnet 4.6 - तर्क नाही 66.7% Z.ai: GLM 4.7 Flash - तर्क नाही 66.7% Google: Gemini 3 Flash Preview - तर्क (low) 33.3% Anthropic: Claude Sonnet 4.6 - तर्क (medium) 0.0% 0.0% 100.0% | 4.00 सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण. क्रमांक: #8/29 ७५% Google: Gemini 3 Flash Preview - तर्क (medium) 10.00 Google: Gemini 3.1 Pro Preview - तर्क (medium) 7.00 Google: Gemini 3 Flash Preview - तर्क नाही 7.00 Anthropic: Claude Sonnet 4.6 - तर्क नाही 7.00 Z.ai: GLM 4.7 Flash - तर्क नाही 7.00 Google: Gemini 3 Flash Preview - तर्क (low) 4.00 Anthropic: Claude Sonnet 4.6 - तर्क (medium) 1.00 1.00 10.00 | 4.41 सुसंगतता गुण रीपीट्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी). क्रमांक: #23/29 २१% Google: Gemini 3 Flash Preview - तर्क (medium) 10.00 Google: Gemini 3.1 Pro Preview - तर्क (medium) 10.00 Google: Gemini 3 Pro Preview - तर्क (medium) 10.00 Google: Gemini 3 Flash Preview - तर्क नाही 10.00 Anthropic: Claude Sonnet 4.6 - तर्क नाही 10.00 Google: Gemini 3 Flash Preview - तर्क (low) 4.41 4.41 10.00 | 55.5% प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रीपीटमधील एकूण प्रयत्न. क्रमांक: #11/29 ६४% Google: Gemini 3 Flash Preview - तर्क (medium) 100.0% Google: Gemini 3.1 Pro Preview - तर्क (medium) 66.7% Google: Gemini 3 Flash Preview - तर्क नाही 66.7% Anthropic: Claude Sonnet 4.6 - तर्क नाही 66.7% Z.ai: GLM 4.7 Flash - तर्क नाही 66.7% Google: Gemini 3 Flash Preview - तर्क (low) 55.5% Z.ai: GLM 5 - तर्क नाही 0.0% 0.0% 100.0% | 2 अस्थिर चाचण्यांत रीपीट्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल). क्रमांक: #23/29 २१% Google: Gemini 3 Flash Preview - तर्क (medium) ० Google: Gemini 3.1 Pro Preview - तर्क (medium) ० Google: Gemini 3 Pro Preview - तर्क (medium) ० Google: Gemini 3 Flash Preview - तर्क नाही ० Anthropic: Claude Sonnet 4.6 - तर्क नाही ० Google: Gemini 3 Flash Preview - तर्क (low) २ ० २ | 1.83 अंतिम उत्तर बरोबर आहे की नाही यापासून स्वतंत्रपणे तर्काची स्पष्टता, कार्यक्षमता आणि सुसंगती मोजते. टीप: काही Gemini मॉडेल्समध्ये फक्त अंशतः reasoning मजकूर उपलब्ध असतो, त्यामुळे reasoning स्कोअर कमी दिसू शकतो. क्रमांक: #18/19 ६% Xiaomi: MiMo-V2-Flash - तर्क (medium) 8.72 OpenAI: gpt-oss-120b - तर्क (medium) 8.53 StepFun: Step 3.5 Flash - तर्क (medium) 8.44 Z.ai: GLM 5 - तर्क (medium) 8.43 Z.ai: GLM 4.7 Flash - तर्क (medium) 8.21 Google: Gemini 3 Flash Preview - तर्क (low) 1.83 OpenAI: GPT-5.3-Codex - तर्क (medium) 1.00 1.00 8.72 | 8314ms | $0.01993 एकूण खर्च क्रमांक: #18/29 ३९% StepFun: Step 3.5 Flash - तर्क (medium) $0.00000 Z.ai: GLM 4.7 Flash - तर्क नाही $0.00005 Xiaomi: MiMo-V2-Flash - तर्क नाही $0.00008 Qwen: Qwen3 Coder Next - तर्क नाही $0.00010 Qwen: Qwen3 Coder Next - तर्क (medium) $0.00010 Google: Gemini 3 Flash Preview - तर्क (low) $0.01993 Anthropic: Claude Sonnet 4.6 - तर्क (medium) $0.64205 $0.00000 $0.64205 |
| सूचनांचे पालन | एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रीपीट पास होतात. सूचनांचे पालन केले नाही: 1 प्रतिसाद वेळ (सरासरी) 7016ms प्रतिसाद वेळ (कमाल) 7350ms प्रतिसाद वेळ (एकूण) 14031ms एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रीपीट पास होतात. क्रमांक: #14/29 ५४% Google: Gemini 3 Flash Preview - तर्क (medium) 100.0% Google: Gemini 3.1 Pro Preview - तर्क (medium) 100.0% Google: Gemini 3 Pro Preview - तर्क (medium) 100.0% Qwen: Qwen3.5 Plus 2026-02-15 - तर्क (medium) 100.0% OpenAI: GPT-5.2 - तर्क (medium) 100.0% Google: Gemini 3 Flash Preview - तर्क (low) 50.0% xAI: Grok 4.1 Fast - तर्क नाही 0.0% 0.0% 100.0% | 7.50 सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण. क्रमांक: #15/29 ५०% Google: Gemini 3 Flash Preview - तर्क (medium) 10.00 Google: Gemini 3.1 Pro Preview - तर्क (medium) 10.00 Anthropic: Claude Sonnet 4.6 - तर्क (medium) 10.00 Z.ai: GLM 5 - तर्क नाही 10.00 OpenAI: gpt-oss-120b - तर्क (medium) 10.00 Google: Gemini 3 Flash Preview - तर्क (low) 7.50 xAI: Grok 4.1 Fast - तर्क नाही 1.00 1.00 10.00 | 9.99 सुसंगतता गुण रीपीट्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी). क्रमांक: #17/29 ४३% Google: Gemini 3 Flash Preview - तर्क (medium) 10.00 Google: Gemini 3.1 Pro Preview - तर्क (medium) 10.00 Google: Gemini 3 Pro Preview - तर्क (medium) 10.00 OpenAI: GPT-5.3-Codex - तर्क (medium) 10.00 OpenAI: GPT-5.2 - तर्क (medium) 10.00 Google: Gemini 3 Flash Preview - तर्क (low) 9.99 Xiaomi: MiMo-V2-Flash - तर्क (medium) 5.80 5.80 10.00 | 50.0% प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रीपीटमधील एकूण प्रयत्न. क्रमांक: #19/29 ३६% Google: Gemini 3 Flash Preview - तर्क (medium) 100.0% Google: Gemini 3.1 Pro Preview - तर्क (medium) 100.0% Google: Gemini 3 Pro Preview - तर्क (medium) 100.0% Qwen: Qwen3.5 Plus 2026-02-15 - तर्क (medium) 100.0% OpenAI: GPT-5.2 - तर्क (medium) 100.0% Google: Gemini 3 Flash Preview - तर्क (low) 50.0% xAI: Grok 4.1 Fast - तर्क नाही 0.0% 0.0% 100.0% | 0 अस्थिर चाचण्यांत रीपीट्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल). क्रमांक: #5/29 ८६% Google: Gemini 3 Flash Preview - तर्क (medium) ० Google: Gemini 3.1 Pro Preview - तर्क (medium) ० Google: Gemini 3 Pro Preview - तर्क (medium) ० Qwen: Qwen3.5 Plus 2026-02-15 - तर्क (medium) ० Google: Gemini 3 Flash Preview - तर्क (low) ० Google: Gemini 3 Flash Preview - तर्क नाही १ ० १ | 5.00 अंतिम उत्तर बरोबर आहे की नाही यापासून स्वतंत्रपणे तर्काची स्पष्टता, कार्यक्षमता आणि सुसंगती मोजते. टीप: काही Gemini मॉडेल्समध्ये फक्त अंशतः reasoning मजकूर उपलब्ध असतो, त्यामुळे reasoning स्कोअर कमी दिसू शकतो. क्रमांक: #17/19 ११% Anthropic: Claude Sonnet 4.6 - तर्क (medium) 10.00 Z.ai: GLM 5 - तर्क (medium) 9.75 StepFun: Step 3.5 Flash - तर्क (medium) 9.67 Anthropic: Claude Opus 4.6 - तर्क (medium) 9.50 OpenAI: gpt-oss-120b - तर्क (medium) 9.50 Google: Gemini 3 Flash Preview - तर्क (low) 5.00 OpenAI: GPT-5.3-Codex - तर्क (medium) 1.00 1.00 10.00 | 7016ms | $0.00878 एकूण खर्च क्रमांक: #20/29 ३२% StepFun: Step 3.5 Flash - तर्क (medium) $0.00000 Z.ai: GLM 4.7 Flash - तर्क नाही $0.00006 Xiaomi: MiMo-V2-Flash - तर्क नाही $0.00008 Qwen: Qwen3 Coder Next - तर्क नाही $0.00013 Qwen: Qwen3 Coder Next - तर्क (medium) $0.00014 Google: Gemini 3 Flash Preview - तर्क (low) $0.00878 Google: Gemini 3.1 Pro Preview - तर्क (medium) $0.03134 $0.00000 $0.03134 |
| Puzzle Solving | एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रीपीट पास होतात. अयशस्वी उत्तरे नाहीत. प्रतिसाद वेळ (सरासरी) 6440ms प्रतिसाद वेळ (कमाल) 10274ms प्रतिसाद वेळ (एकूण) 19319ms एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रीपीट पास होतात. क्रमांक: #5/29 ८६% Google: Gemini 3 Flash Preview - तर्क (medium) 100.0% Google: Gemini 3.1 Pro Preview - तर्क (medium) 100.0% Google: Gemini 3 Pro Preview - तर्क (medium) 100.0% Qwen: Qwen3.5 Plus 2026-02-15 - तर्क (medium) 100.0% Google: Gemini 3 Flash Preview - तर्क (low) 100.0% StepFun: Step 3.5 Flash - तर्क (medium) 0.0% 0.0% 100.0% | 10.00 सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण. क्रमांक: #4/29 ८९% Google: Gemini 3.1 Pro Preview - तर्क (medium) 10.00 Google: Gemini 3 Pro Preview - तर्क (medium) 10.00 Qwen: Qwen3.5 Plus 2026-02-15 - तर्क (medium) 10.00 Google: Gemini 3 Flash Preview - तर्क (low) 10.00 Anthropic: Claude Sonnet 4.6 - तर्क (medium) 10.00 Xiaomi: MiMo-V2-Flash - तर्क (medium) 1.00 1.00 10.00 | 10.00 सुसंगतता गुण रीपीट्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी). क्रमांक: #5/29 ८६% Google: Gemini 3 Flash Preview - तर्क (medium) 10.00 Google: Gemini 3.1 Pro Preview - तर्क (medium) 10.00 Google: Gemini 3 Pro Preview - तर्क (medium) 10.00 Qwen: Qwen3.5 Plus 2026-02-15 - तर्क (medium) 10.00 Google: Gemini 3 Flash Preview - तर्क (low) 10.00 MiniMax: MiniMax M2.5 - तर्क (medium) 4.79 4.79 10.00 | 100.0% प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रीपीटमधील एकूण प्रयत्न. क्रमांक: #5/29 ८६% Google: Gemini 3 Flash Preview - तर्क (medium) 100.0% Google: Gemini 3.1 Pro Preview - तर्क (medium) 100.0% Google: Gemini 3 Pro Preview - तर्क (medium) 100.0% Qwen: Qwen3.5 Plus 2026-02-15 - तर्क (medium) 100.0% Google: Gemini 3 Flash Preview - तर्क (low) 100.0% OpenAI: GPT-4o-mini - तर्क नाही 0.0% 0.0% 100.0% | 0 अस्थिर चाचण्यांत रीपीट्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल). क्रमांक: #5/29 ८६% Google: Gemini 3 Flash Preview - तर्क (medium) ० Google: Gemini 3.1 Pro Preview - तर्क (medium) ० Google: Gemini 3 Pro Preview - तर्क (medium) ० Qwen: Qwen3.5 Plus 2026-02-15 - तर्क (medium) ० Google: Gemini 3 Flash Preview - तर्क (low) ० OpenAI: GPT-5 Nano - तर्क (medium) २ ० २ | 7.50 अंतिम उत्तर बरोबर आहे की नाही यापासून स्वतंत्रपणे तर्काची स्पष्टता, कार्यक्षमता आणि सुसंगती मोजते. टीप: काही Gemini मॉडेल्समध्ये फक्त अंशतः reasoning मजकूर उपलब्ध असतो, त्यामुळे reasoning स्कोअर कमी दिसू शकतो. क्रमांक: #13/19 ३३% Z.ai: GLM 5 - तर्क (medium) 9.50 Anthropic: Claude Sonnet 4.6 - तर्क (medium) 9.44 Anthropic: Claude Opus 4.6 - तर्क (medium) 9.44 MoonshotAI: Kimi K2.5 - तर्क (medium) 9.26 StepFun: Step 3.5 Flash - तर्क (medium) 9.22 Google: Gemini 3 Flash Preview - तर्क (low) 7.50 Qwen: Qwen3 Coder Next - तर्क (medium) 4.33 4.33 9.50 | 6440ms | $0.01105 एकूण खर्च क्रमांक: #17/29 ४३% StepFun: Step 3.5 Flash - तर्क (medium) $0.00000 Z.ai: GLM 4.7 Flash - तर्क नाही $0.00008 OpenAI: GPT-4o-mini - तर्क नाही $0.00028 xAI: Grok 4.1 Fast - तर्क नाही $0.00053 Qwen: Qwen3 Coder Next - तर्क (medium) $0.00058 Google: Gemini 3 Flash Preview - तर्क (low) $0.01105 Qwen: Qwen3.5 Plus 2026-02-15 - तर्क (medium) $0.05508 $0.00000 $0.05508 |