AI BENCHY
Bandingkan
❤️ Made by XCS

Nama Model

OpenAI: gpt-oss-120b

Benchmark dihasilkan dari suite pengujian Aibenchy pada : 19 Feb 2026

Metrik OpenAI: gpt-oss-120b
Peringkat#12
PerusahaanOpenAI
Score 5.75
Konsistensi 7.19
Biaya per hasil 0.0951
Total Biaya $0.00571
Tes benar 6/12
Tingkat lulus per percobaan 63.9%
Tes tidak stabil 4
Token output 8,060
Token penalaran 23,792

Rincian Kategori

Kategori Tes lulus penuh Score Konsistensi Tingkat lulus per percobaan Tes tidak stabil Skor penalaran Biaya
Anti-AI Tricks 2/2 10.00 10.00 100.0% 0 10.00 $0.00029
Data parsing and extraction 1/2 5.50 5.81 83.3% 1 10.00 $0.00052
Domain specific 0/3 1.00 4.41 22.2% 2 8.53 $0.00393
Instructions following 2/2 10.00 10.00 100.0% 0 9.50 $0.00040
Puzzle Solving 1/3 5.00 7.13 44.4% 1 7.89 $0.00059

Model yang Dibandingkan

Bandingkan OpenAI: gpt-oss-120b dengan...

#11 · OpenAI

OpenAI: GPT-5 Nano

Penalaran (medium)

Score: 5.92

Konsistensi: 6.03

Tingkat lulus per percobaan: 72.2%

Tes tidak stabil: 6

Biaya per hasil: 0.4675

Tes benar: 6/12

Total Biaya: $0.02806

Bandingkan

#13 · Anthropic

Anthropic: Claude Sonnet 4.6

Tanpa penalaran

Score: 5.75

Konsistensi: 9.42

Tingkat lulus per percobaan: 52.8%

Tes tidak stabil: 1

Biaya per hasil: 0.9480

Tes benar: 6/12

Total Biaya: $0.05688

Bandingkan

#10 · Google

Google: Gemini 3 Flash Preview

Tanpa penalaran

Score: 6.25

Konsistensi: 8.60

Tingkat lulus per percobaan: 66.7%

Tes tidak stabil: 2

Biaya per hasil: 0.0754

Tes benar: 7/12

Total Biaya: $0.00528

Bandingkan

Perbandingan Cepat

Bandingkan OpenAI: gpt-oss-120b dengan...