| Trik anti-AI | Tes dianggap lulus penuh hanya jika semua pengulangannya lulus. Tidak ada jawaban gagal. Waktu respons (rata-rata) 4687ms Waktu respons (maks) 6680ms Waktu respons (total) 14061ms Tes dianggap lulus penuh hanya jika semua pengulangannya lulus. Peringkat: #6/29 82% Google: Gemini 3 Flash Preview - Penalaran (medium) 100.0% Google: Gemini 3.1 Pro Preview - Penalaran (medium) 100.0% Google: Gemini 3 Pro Preview - Penalaran (medium) 100.0% Qwen: Qwen3.5 Plus 2026-02-15 - Penalaran (medium) 100.0% Google: Gemini 3 Flash Preview - Penalaran (low) 100.0% OpenAI: GPT-5.3-Codex - Penalaran (medium) 100.0% MoonshotAI: Kimi K2.5 - Tanpa penalaran 0.0% 0.0% 100.0% | 10.00 Skor rata-rata di semua tes benchmark. Peringkat: #6/29 82% Google: Gemini 3 Flash Preview - Penalaran (medium) 10.00 Google: Gemini 3.1 Pro Preview - Penalaran (medium) 10.00 Google: Gemini 3 Pro Preview - Penalaran (medium) 10.00 Qwen: Qwen3.5 Plus 2026-02-15 - Penalaran (medium) 10.00 Google: Gemini 3 Flash Preview - Penalaran (low) 10.00 OpenAI: GPT-5.3-Codex - Penalaran (medium) 10.00 Z.ai: GLM 4.7 Flash - Tanpa penalaran 1.00 1.00 10.00 | 10.00 Skor konsistensi mencerminkan kestabilan antar pengulangan (10 = sangat konsisten, bahkan jika konsisten salah). Peringkat: #6/29 82% Google: Gemini 3 Flash Preview - Penalaran (medium) 10.00 Google: Gemini 3.1 Pro Preview - Penalaran (medium) 10.00 Google: Gemini 3 Pro Preview - Penalaran (medium) 10.00 Qwen: Qwen3.5 Plus 2026-02-15 - Penalaran (medium) 10.00 Google: Gemini 3 Flash Preview - Penalaran (low) 10.00 OpenAI: GPT-5.3-Codex - Penalaran (medium) 10.00 Anthropic: Claude Opus 4.6 - Penalaran (medium) 4.41 4.41 10.00 | 100.0% Tingkat lulus per percobaan = percobaan lulus / total percobaan di semua pengulangan. Peringkat: #6/29 82% Google: Gemini 3 Flash Preview - Penalaran (medium) 100.0% Google: Gemini 3.1 Pro Preview - Penalaran (medium) 100.0% Google: Gemini 3 Pro Preview - Penalaran (medium) 100.0% Qwen: Qwen3.5 Plus 2026-02-15 - Penalaran (medium) 100.0% Google: Gemini 3 Flash Preview - Penalaran (low) 100.0% OpenAI: GPT-5.3-Codex - Penalaran (medium) 100.0% xAI: Grok 4.1 Fast - Tanpa penalaran 0.0% 0.0% 100.0% | 0 Tes tidak stabil memiliki hasil campuran antar pengulangan (setidaknya satu lulus dan satu gagal). Peringkat: #6/29 82% Google: Gemini 3 Flash Preview - Penalaran (medium) 0 Google: Gemini 3.1 Pro Preview - Penalaran (medium) 0 Google: Gemini 3 Pro Preview - Penalaran (medium) 0 Qwen: Qwen3.5 Plus 2026-02-15 - Penalaran (medium) 0 Google: Gemini 3 Flash Preview - Penalaran (low) 0 OpenAI: GPT-5.3-Codex - Penalaran (medium) 0 Anthropic: Claude Opus 4.6 - Penalaran (medium) 2 0 2 | 6.00 Mengukur kejernihan, efisiensi, dan konsistensi penalaran secara terpisah dari kebenaran jawaban akhir. Peringkat: #15/19 22% Anthropic: Claude Opus 4.6 - Penalaran (medium) 10.00 OpenAI: gpt-oss-120b - Penalaran (medium) 10.00 Anthropic: Claude Sonnet 4.6 - Penalaran (medium) 9.89 Z.ai: GLM 5 - Penalaran (medium) 9.83 StepFun: Step 3.5 Flash - Penalaran (medium) 9.83 OpenAI: GPT-5.3-Codex - Penalaran (medium) 6.00 Qwen: Qwen3 Coder Next - Penalaran (medium) 4.00 4.00 10.00 | 4687ms | $0.02371 Total Biaya Peringkat: #24/29 18% StepFun: Step 3.5 Flash - Penalaran (medium) $0.00000 OpenAI: GPT-4o-mini - Tanpa penalaran $0.00018 Z.ai: GLM 4.7 Flash - Tanpa penalaran $0.00020 Xiaomi: MiMo-V2-Flash - Tanpa penalaran $0.00024 xAI: Grok 4.1 Fast - Tanpa penalaran $0.00049 OpenAI: GPT-5.3-Codex - Penalaran (medium) $0.02371 Anthropic: Claude Opus 4.6 - Penalaran (medium) $0.05049 $0.00000 $0.05049 |
| Parsing dan ekstraksi data | Tes dianggap lulus penuh hanya jika semua pengulangannya lulus. Tidak ada jawaban gagal. Waktu respons (rata-rata) 3180ms Waktu respons (maks) 3585ms Waktu respons (total) 6360ms Tes dianggap lulus penuh hanya jika semua pengulangannya lulus. Peringkat: #6/29 82% Google: Gemini 3 Flash Preview - Penalaran (medium) 100.0% Google: Gemini 3.1 Pro Preview - Penalaran (medium) 100.0% Google: Gemini 3 Pro Preview - Penalaran (medium) 100.0% Qwen: Qwen3.5 Plus 2026-02-15 - Penalaran (medium) 100.0% Google: Gemini 3 Flash Preview - Penalaran (low) 100.0% OpenAI: GPT-5.3-Codex - Penalaran (medium) 100.0% Z.ai: GLM 4.7 Flash - Tanpa penalaran 0.0% 0.0% 100.0% | 10.00 Skor rata-rata di semua tes benchmark. Peringkat: #6/29 82% Google: Gemini 3 Flash Preview - Penalaran (medium) 10.00 Google: Gemini 3.1 Pro Preview - Penalaran (medium) 10.00 Google: Gemini 3 Pro Preview - Penalaran (medium) 10.00 Qwen: Qwen3.5 Plus 2026-02-15 - Penalaran (medium) 10.00 Google: Gemini 3 Flash Preview - Penalaran (low) 10.00 OpenAI: GPT-5.3-Codex - Penalaran (medium) 10.00 Z.ai: GLM 4.7 Flash - Tanpa penalaran 0.50 0.50 10.00 | 10.00 Skor konsistensi mencerminkan kestabilan antar pengulangan (10 = sangat konsisten, bahkan jika konsisten salah). Peringkat: #6/29 82% Google: Gemini 3 Flash Preview - Penalaran (medium) 10.00 Google: Gemini 3.1 Pro Preview - Penalaran (medium) 10.00 Google: Gemini 3 Pro Preview - Penalaran (medium) 10.00 Qwen: Qwen3.5 Plus 2026-02-15 - Penalaran (medium) 10.00 Google: Gemini 3 Flash Preview - Penalaran (low) 10.00 OpenAI: GPT-5.3-Codex - Penalaran (medium) 10.00 Z.ai: GLM 5 - Penalaran (medium) 5.56 5.56 10.00 | 100.0% Tingkat lulus per percobaan = percobaan lulus / total percobaan di semua pengulangan. Peringkat: #6/29 82% Google: Gemini 3 Flash Preview - Penalaran (medium) 100.0% Google: Gemini 3.1 Pro Preview - Penalaran (medium) 100.0% Google: Gemini 3 Pro Preview - Penalaran (medium) 100.0% Qwen: Qwen3.5 Plus 2026-02-15 - Penalaran (medium) 100.0% Google: Gemini 3 Flash Preview - Penalaran (low) 100.0% OpenAI: GPT-5.3-Codex - Penalaran (medium) 100.0% Xiaomi: MiMo-V2-Flash - Tanpa penalaran 16.7% 0.0% 100.0% | 0 Tes tidak stabil memiliki hasil campuran antar pengulangan (setidaknya satu lulus dan satu gagal). Peringkat: #6/29 82% Google: Gemini 3 Flash Preview - Penalaran (medium) 0 Google: Gemini 3.1 Pro Preview - Penalaran (medium) 0 Google: Gemini 3 Pro Preview - Penalaran (medium) 0 Qwen: Qwen3.5 Plus 2026-02-15 - Penalaran (medium) 0 Google: Gemini 3 Flash Preview - Penalaran (low) 0 OpenAI: GPT-5.3-Codex - Penalaran (medium) 0 Z.ai: GLM 5 - Penalaran (medium) 1 0 1 | 1.25 Mengukur kejernihan, efisiensi, dan konsistensi penalaran secara terpisah dari kebenaran jawaban akhir. Peringkat: #19/19 0% OpenAI: gpt-oss-120b - Penalaran (medium) 10.00 Z.ai: GLM 4.7 Flash - Penalaran (medium) 9.87 Anthropic: Claude Sonnet 4.6 - Penalaran (medium) 9.83 Anthropic: Claude Opus 4.6 - Penalaran (medium) 9.83 Z.ai: GLM 5 - Penalaran (medium) 9.80 OpenAI: GPT-5.3-Codex - Penalaran (medium) 1.25 1.25 10.00 | 3180ms | $0.02600 Total Biaya Peringkat: #23/29 21% StepFun: Step 3.5 Flash - Penalaran (medium) $0.00000 Xiaomi: MiMo-V2-Flash - Penalaran (medium) $0.00029 Xiaomi: MiMo-V2-Flash - Tanpa penalaran $0.00029 Z.ai: GLM 4.7 Flash - Tanpa penalaran $0.00050 OpenAI: gpt-oss-120b - Penalaran (medium) $0.00052 OpenAI: GPT-5.3-Codex - Penalaran (medium) $0.02600 Anthropic: Claude Opus 4.6 - Penalaran (medium) $0.07755 $0.00000 $0.07755 |
| Spesifik domain | Tes dianggap lulus penuh hanya jika semua pengulangannya lulus. Jawaban salah: 2 Waktu respons (rata-rata) 64314ms Waktu respons (maks) 100927ms Waktu respons (total) 192942ms Tes dianggap lulus penuh hanya jika semua pengulangannya lulus. Peringkat: #9/29 71% Google: Gemini 3 Flash Preview - Penalaran (medium) 100.0% Google: Gemini 3.1 Pro Preview - Penalaran (medium) 66.7% Google: Gemini 3 Flash Preview - Tanpa penalaran 66.7% Anthropic: Claude Sonnet 4.6 - Tanpa penalaran 66.7% Z.ai: GLM 4.7 Flash - Tanpa penalaran 66.7% OpenAI: GPT-5.3-Codex - Penalaran (medium) 33.3% Anthropic: Claude Sonnet 4.6 - Penalaran (medium) 0.0% 0.0% 100.0% | 4.00 Skor rata-rata di semua tes benchmark. Peringkat: #9/29 71% Google: Gemini 3 Flash Preview - Penalaran (medium) 10.00 Google: Gemini 3.1 Pro Preview - Penalaran (medium) 7.00 Google: Gemini 3 Flash Preview - Tanpa penalaran 7.00 Anthropic: Claude Sonnet 4.6 - Tanpa penalaran 7.00 Z.ai: GLM 4.7 Flash - Tanpa penalaran 7.00 OpenAI: GPT-5.3-Codex - Penalaran (medium) 4.00 Anthropic: Claude Sonnet 4.6 - Penalaran (medium) 1.00 1.00 10.00 | 7.21 Skor konsistensi mencerminkan kestabilan antar pengulangan (10 = sangat konsisten, bahkan jika konsisten salah). Peringkat: #15/29 50% Google: Gemini 3 Flash Preview - Penalaran (medium) 10.00 Google: Gemini 3.1 Pro Preview - Penalaran (medium) 10.00 Google: Gemini 3 Pro Preview - Penalaran (medium) 10.00 Google: Gemini 3 Flash Preview - Tanpa penalaran 10.00 Anthropic: Claude Sonnet 4.6 - Tanpa penalaran 10.00 OpenAI: GPT-5.3-Codex - Penalaran (medium) 7.21 Google: Gemini 3 Flash Preview - Penalaran (low) 4.41 4.41 10.00 | 55.6% Tingkat lulus per percobaan = percobaan lulus / total percobaan di semua pengulangan. Peringkat: #6/29 82% Google: Gemini 3 Flash Preview - Penalaran (medium) 100.0% Google: Gemini 3.1 Pro Preview - Penalaran (medium) 66.7% Google: Gemini 3 Flash Preview - Tanpa penalaran 66.7% Anthropic: Claude Sonnet 4.6 - Tanpa penalaran 66.7% Z.ai: GLM 4.7 Flash - Tanpa penalaran 66.7% OpenAI: GPT-5.3-Codex - Penalaran (medium) 55.6% Z.ai: GLM 5 - Tanpa penalaran 0.0% 0.0% 100.0% | 1 Tes tidak stabil memiliki hasil campuran antar pengulangan (setidaknya satu lulus dan satu gagal). Peringkat: #15/29 50% Google: Gemini 3 Flash Preview - Penalaran (medium) 0 Google: Gemini 3.1 Pro Preview - Penalaran (medium) 0 Google: Gemini 3 Pro Preview - Penalaran (medium) 0 Google: Gemini 3 Flash Preview - Tanpa penalaran 0 Anthropic: Claude Sonnet 4.6 - Tanpa penalaran 0 OpenAI: GPT-5.3-Codex - Penalaran (medium) 1 Google: Gemini 3 Flash Preview - Penalaran (low) 2 0 2 | 1.00 Mengukur kejernihan, efisiensi, dan konsistensi penalaran secara terpisah dari kebenaran jawaban akhir. Peringkat: #19/19 0% Xiaomi: MiMo-V2-Flash - Penalaran (medium) 8.72 OpenAI: gpt-oss-120b - Penalaran (medium) 8.53 StepFun: Step 3.5 Flash - Penalaran (medium) 8.44 Z.ai: GLM 5 - Penalaran (medium) 8.43 Z.ai: GLM 4.7 Flash - Penalaran (medium) 8.21 OpenAI: GPT-5.3-Codex - Penalaran (medium) 1.00 1.00 8.72 | 64314ms | $0.35664 Total Biaya Peringkat: #27/29 7% StepFun: Step 3.5 Flash - Penalaran (medium) $0.00000 Z.ai: GLM 4.7 Flash - Tanpa penalaran $0.00005 Xiaomi: MiMo-V2-Flash - Tanpa penalaran $0.00008 Qwen: Qwen3 Coder Next - Tanpa penalaran $0.00010 Qwen: Qwen3 Coder Next - Penalaran (medium) $0.00010 OpenAI: GPT-5.3-Codex - Penalaran (medium) $0.35664 Anthropic: Claude Sonnet 4.6 - Penalaran (medium) $0.64205 $0.00000 $0.64205 |
| Kepatuhan instruksi | Tes dianggap lulus penuh hanya jika semua pengulangannya lulus. Tidak mengikuti instruksi: 1 Waktu respons (rata-rata) 3037ms Waktu respons (maks) 3436ms Waktu respons (total) 6074ms Tes dianggap lulus penuh hanya jika semua pengulangannya lulus. Peringkat: #15/29 50% Google: Gemini 3 Flash Preview - Penalaran (medium) 100.0% Google: Gemini 3.1 Pro Preview - Penalaran (medium) 100.0% Google: Gemini 3 Pro Preview - Penalaran (medium) 100.0% Qwen: Qwen3.5 Plus 2026-02-15 - Penalaran (medium) 100.0% OpenAI: GPT-5.2 - Penalaran (medium) 100.0% OpenAI: GPT-5.3-Codex - Penalaran (medium) 50.0% xAI: Grok 4.1 Fast - Tanpa penalaran 0.0% 0.0% 100.0% | 9.00 Skor rata-rata di semua tes benchmark. Peringkat: #14/29 54% Google: Gemini 3 Flash Preview - Penalaran (medium) 10.00 Google: Gemini 3.1 Pro Preview - Penalaran (medium) 10.00 Anthropic: Claude Sonnet 4.6 - Penalaran (medium) 10.00 Z.ai: GLM 5 - Tanpa penalaran 10.00 OpenAI: gpt-oss-120b - Penalaran (medium) 10.00 OpenAI: GPT-5.3-Codex - Penalaran (medium) 9.00 xAI: Grok 4.1 Fast - Tanpa penalaran 1.00 1.00 10.00 | 10.00 Skor konsistensi mencerminkan kestabilan antar pengulangan (10 = sangat konsisten, bahkan jika konsisten salah). Peringkat: #4/29 89% Google: Gemini 3 Flash Preview - Penalaran (medium) 10.00 Google: Gemini 3.1 Pro Preview - Penalaran (medium) 10.00 Google: Gemini 3 Pro Preview - Penalaran (medium) 10.00 OpenAI: GPT-5.3-Codex - Penalaran (medium) 10.00 OpenAI: GPT-5.2 - Penalaran (medium) 10.00 Xiaomi: MiMo-V2-Flash - Penalaran (medium) 5.80 5.80 10.00 | 50.0% Tingkat lulus per percobaan = percobaan lulus / total percobaan di semua pengulangan. Peringkat: #20/29 32% Google: Gemini 3 Flash Preview - Penalaran (medium) 100.0% Google: Gemini 3.1 Pro Preview - Penalaran (medium) 100.0% Google: Gemini 3 Pro Preview - Penalaran (medium) 100.0% Qwen: Qwen3.5 Plus 2026-02-15 - Penalaran (medium) 100.0% OpenAI: GPT-5.2 - Penalaran (medium) 100.0% OpenAI: GPT-5.3-Codex - Penalaran (medium) 50.0% xAI: Grok 4.1 Fast - Tanpa penalaran 0.0% 0.0% 100.0% | 0 Tes tidak stabil memiliki hasil campuran antar pengulangan (setidaknya satu lulus dan satu gagal). Peringkat: #6/29 82% Google: Gemini 3 Flash Preview - Penalaran (medium) 0 Google: Gemini 3.1 Pro Preview - Penalaran (medium) 0 Google: Gemini 3 Pro Preview - Penalaran (medium) 0 Qwen: Qwen3.5 Plus 2026-02-15 - Penalaran (medium) 0 Google: Gemini 3 Flash Preview - Penalaran (low) 0 OpenAI: GPT-5.3-Codex - Penalaran (medium) 0 Google: Gemini 3 Flash Preview - Tanpa penalaran 1 0 1 | 1.00 Mengukur kejernihan, efisiensi, dan konsistensi penalaran secara terpisah dari kebenaran jawaban akhir. Peringkat: #19/19 0% Anthropic: Claude Sonnet 4.6 - Penalaran (medium) 10.00 Z.ai: GLM 5 - Penalaran (medium) 9.75 StepFun: Step 3.5 Flash - Penalaran (medium) 9.67 Anthropic: Claude Opus 4.6 - Penalaran (medium) 9.50 OpenAI: gpt-oss-120b - Penalaran (medium) 9.50 OpenAI: GPT-5.3-Codex - Penalaran (medium) 1.00 1.00 10.00 | 3037ms | $0.01216 Total Biaya Peringkat: #23/29 21% StepFun: Step 3.5 Flash - Penalaran (medium) $0.00000 Z.ai: GLM 4.7 Flash - Tanpa penalaran $0.00006 Xiaomi: MiMo-V2-Flash - Tanpa penalaran $0.00008 Qwen: Qwen3 Coder Next - Tanpa penalaran $0.00013 Qwen: Qwen3 Coder Next - Penalaran (medium) $0.00014 OpenAI: GPT-5.3-Codex - Penalaran (medium) $0.01216 Google: Gemini 3.1 Pro Preview - Penalaran (medium) $0.03134 $0.00000 $0.03134 |
| Puzzle Solving | Tes dianggap lulus penuh hanya jika semua pengulangannya lulus. Tidak mengikuti instruksi: 1 Waktu respons (rata-rata) 4610ms Waktu respons (maks) 7191ms Waktu respons (total) 13830ms Tes dianggap lulus penuh hanya jika semua pengulangannya lulus. Peringkat: #8/29 75% Google: Gemini 3 Flash Preview - Penalaran (medium) 100.0% Google: Gemini 3.1 Pro Preview - Penalaran (medium) 100.0% Google: Gemini 3 Pro Preview - Penalaran (medium) 100.0% Qwen: Qwen3.5 Plus 2026-02-15 - Penalaran (medium) 100.0% Google: Gemini 3 Flash Preview - Penalaran (low) 100.0% OpenAI: GPT-5.3-Codex - Penalaran (medium) 66.7% StepFun: Step 3.5 Flash - Penalaran (medium) 0.0% 0.0% 100.0% | 7.00 Skor rata-rata di semua tes benchmark. Peringkat: #9/29 71% Google: Gemini 3.1 Pro Preview - Penalaran (medium) 10.00 Google: Gemini 3 Pro Preview - Penalaran (medium) 10.00 Qwen: Qwen3.5 Plus 2026-02-15 - Penalaran (medium) 10.00 Google: Gemini 3 Flash Preview - Penalaran (low) 10.00 Anthropic: Claude Sonnet 4.6 - Penalaran (medium) 10.00 OpenAI: GPT-5.3-Codex - Penalaran (medium) 7.00 Xiaomi: MiMo-V2-Flash - Penalaran (medium) 1.00 1.00 10.00 | 7.38 Skor konsistensi mencerminkan kestabilan antar pengulangan (10 = sangat konsisten, bahkan jika konsisten salah). Peringkat: #20/29 32% Google: Gemini 3 Flash Preview - Penalaran (medium) 10.00 Google: Gemini 3.1 Pro Preview - Penalaran (medium) 10.00 Google: Gemini 3 Pro Preview - Penalaran (medium) 10.00 Qwen: Qwen3.5 Plus 2026-02-15 - Penalaran (medium) 10.00 Google: Gemini 3 Flash Preview - Penalaran (low) 10.00 OpenAI: GPT-5.3-Codex - Penalaran (medium) 7.38 MiniMax: MiniMax M2.5 - Penalaran (medium) 4.79 4.79 10.00 | 77.8% Tingkat lulus per percobaan = percobaan lulus / total percobaan di semua pengulangan. Peringkat: #8/29 75% Google: Gemini 3 Flash Preview - Penalaran (medium) 100.0% Google: Gemini 3.1 Pro Preview - Penalaran (medium) 100.0% Google: Gemini 3 Pro Preview - Penalaran (medium) 100.0% Qwen: Qwen3.5 Plus 2026-02-15 - Penalaran (medium) 100.0% Google: Gemini 3 Flash Preview - Penalaran (low) 100.0% OpenAI: GPT-5.3-Codex - Penalaran (medium) 77.8% OpenAI: GPT-4o-mini - Tanpa penalaran 0.0% 0.0% 100.0% | 1 Tes tidak stabil memiliki hasil campuran antar pengulangan (setidaknya satu lulus dan satu gagal). Peringkat: #18/29 39% Google: Gemini 3 Flash Preview - Penalaran (medium) 0 Google: Gemini 3.1 Pro Preview - Penalaran (medium) 0 Google: Gemini 3 Pro Preview - Penalaran (medium) 0 Qwen: Qwen3.5 Plus 2026-02-15 - Penalaran (medium) 0 Google: Gemini 3 Flash Preview - Penalaran (low) 0 OpenAI: GPT-5.3-Codex - Penalaran (medium) 1 OpenAI: GPT-5 Nano - Penalaran (medium) 2 0 2 | 6.00 Mengukur kejernihan, efisiensi, dan konsistensi penalaran secara terpisah dari kebenaran jawaban akhir. Peringkat: #18/19 6% Z.ai: GLM 5 - Penalaran (medium) 9.50 Anthropic: Claude Sonnet 4.6 - Penalaran (medium) 9.44 Anthropic: Claude Opus 4.6 - Penalaran (medium) 9.44 MoonshotAI: Kimi K2.5 - Penalaran (medium) 9.26 StepFun: Step 3.5 Flash - Penalaran (medium) 9.22 OpenAI: GPT-5.3-Codex - Penalaran (medium) 6.00 Qwen: Qwen3 Coder Next - Penalaran (medium) 4.33 4.33 9.50 | 4610ms | $0.02559 Total Biaya Peringkat: #25/29 14% StepFun: Step 3.5 Flash - Penalaran (medium) $0.00000 Z.ai: GLM 4.7 Flash - Tanpa penalaran $0.00008 OpenAI: GPT-4o-mini - Tanpa penalaran $0.00028 xAI: Grok 4.1 Fast - Tanpa penalaran $0.00053 Qwen: Qwen3 Coder Next - Penalaran (medium) $0.00058 OpenAI: GPT-5.3-Codex - Penalaran (medium) $0.02559 Qwen: Qwen3.5 Plus 2026-02-15 - Penalaran (medium) $0.05508 $0.00000 $0.05508 |