Claude Opus 4.7 (medium) vs Gemini 3.1 Flash Lite Preview (low)

Model yang direkomendasikan Claude Opus 4.7 (medium)

It has the best score here (8.7), while responding about 2.2x faster than Gemini 3.1 Flash Lite Preview (low).

Perbandingan terperinci

Metrik	Claude Opus 4.7 Claude Opus 4.7 medium Rilis: 2026-04-16	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low Rilis: 2026-03-03

Metrik	Claude Opus 4.7 Claude Opus 4.7 medium Rilis: 2026-04-16	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low Rilis: 2026-03-03
Skor	8.7	6.5
Peringkat	#20	#114
Keandalan	10.0	10.0
Konsistensi	9.6	10.0
Tes benar
Tingkat lulus per percobaan	83.3%	59.1%
Tes tidak stabil	1	0
Total Run	66	66
Biaya per hasil	8.201	4.969
Total Biaya	$1.477	$0.646
Harga input	$5.000 / 1M	$0.250 / 1M
Harga output	$25.000 / 1M	$1.500 / 1M
Total token input	145,252	110,185
Token output	24,948	14,717
Token penalaran	5,042	397,483
Waktu respons (rata-rata)	7.61s	16.70s
Waktu respons (maks)	65.40s	309.35s
Waktu respons (total)	159.91s	367.47s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

medium

low

Kategori:

Trik anti-AI	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Claude Opus 4.7	8.3	10.0	75.0%	0		1.85s	894	348	0
Gemini 3.1 Flash Lite Preview	8.3	10.0	75.0%	0		2.12s	506	462	1,638

Pemrograman	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Claude Opus 4.7	7.6	7.2	77.8%	1		12.96s	10,635	7,629	1,114
Gemini 3.1 Flash Lite Preview	5.5	10.0	33.3%	0		1.39s	8,138	660	1,060

Gabungan	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Claude Opus 4.7	10.0	10.0	100.0%	0		43.42s	104,347	15,459	3,928
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		160.63s	85,851	12,656	389,079

Parsing dan ekstraksi data	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Claude Opus 4.7	10.0	10.0	100.0%	0		2.37s	10,533	324	0
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.00s	7,455	291	696

Spesifik domain	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Claude Opus 4.7	7.7	10.0	66.7%	0		1.17s	630	51	0
Gemini 3.1 Flash Lite Preview	5.3	10.0	33.3%	0		2.36s	641	18	1,212

Kecerdasan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Claude Opus 4.7	10.0	10.0	100.0%	0		2.87s	723	256	0
Gemini 3.1 Flash Lite Preview	4.0	10.0	0.0%	0		1.54s	490	69	384

Kepatuhan instruksi	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Claude Opus 4.7	10.0	10.0	100.0%	0		1.57s	939	114	0
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.49s	621	72	753

Pemecahan teka-teki	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Claude Opus 4.7	10.0	10.0	100.0%	0		2.43s	939	370	0
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.69s	566	243	1,248

Pemanggilan alat	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Claude Opus 4.7	10.0	10.0	100.0%	0		4.17s	15,339	373	0
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		9.54s	5,757	237	993

Pengetahuan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Claude Opus 4.7	3.0	10.0	0.0%	0		2.25s	273	24	0
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		1.35s	160	9	420

Ganti Pasangan Perbandingan