Navegación
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 3.5 Flash vs MoonshotAI: Kimi K2.7 Code

Resumen

Comparación benchmark de Gemini 3.5 Flash vs Kimi K2.7 Code: Gemini 3.5 Flash lidera en puntuación media con 9.8 vs 7.0. Kimi K2.7 Code tiene menor coste de benchmark con $0.669 vs $1.115. Gemini 3.5 Flash es más rápido con 8.84s vs 83.60s, con tasas de acierto de 96.8% vs 66.7%.

Modelo recomendado: Gemini 3.5 Flash - Tiene la mejor puntuación aquí (9.8) y responde aproximadamente 9.5x más rápido que Kimi K2.7 Code.

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-06-12

Métrica Gemini 3.5 Flash Gemini 3.5 Flash high Lanzamiento: 2026-05-19 Kimi K2.7 Code Kimi K2.7 Code medium Lanzamiento: 2026-06-12
Puntuación 9.8 7.0
Rango #1 #65
Fiabilidad 10.0 9.2
Consistencia 9.6 7.7
Pruebas correctas
Tasa de aciertos por intento 96.8% 66.7%
Pruebas inestables 1 6
Ejecuciones totales 63 63
Costo por resultado 5.575 6.074
Costo total $1.115 $0.669
Precio de entrada $1.500 / 1M $0.950 / 1M
Precio de salida $9.000 / 1M $4.000 / 1M
Total de tokens de entrada 37,594 25,991
Tokens de salida 1,975 80,516
Tokens de razonamiento 115,638 161,391
Tiempo de respuesta (promedio) 8.84s 83.60s
Tiempo de respuesta (máximo) 34.82s 365.80s
Tiempo de respuesta (total) 185.57s 1671.99s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#1 Gemini 3.5 Flash

high
Cost
$0.208
Time
118.2s
Tokens
23,158 tok

#65 MoonshotAI: Kimi K2.7 Code

medium
Cost
$0.025
Time
138.0s
Tokens
6,093 tok

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.57s 492 174 4,997
Kimi K2.7 Code 7.3 5.8 83.3% 2 11.56s 618 3,048 5,041
Programación Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Gemini 3.5 Flash 10.0 10.0 100.0% 0 22.96s 8,118 456 47,129
Kimi K2.7 Code 7.6 7.2 77.8% 1 146.73s 4,650 1,864 25,635
Combinado Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Gemini 3.5 Flash 10.0 10.0 100.0% 0 22.37s 12,873 351 16,323
Kimi K2.7 Code 4.7 1.6 66.7% 1 34.83s 11,271 444 3,906
Análisis y extracción de datos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Gemini 3.5 Flash 10.0 10.0 100.0% 0 6.43s 7,548 279 8,466
Kimi K2.7 Code 10.0 10.0 100.0% 0 12.27s 7,014 248 2,569
Específico del dominio Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Gemini 3.5 Flash 7.6 7.2 77.8% 1 14.09s 633 12 24,721
Kimi K2.7 Code 5.3 7.2 44.4% 1 213.29s 431 55,572 63,639
Inteligencia general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.63s 486 115 1,650
Kimi K2.7 Code 10.0 10.0 100.0% 0 10.78s 477 1,024 1,071
Seguimiento de instrucciones Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.35s 615 70 3,799
Kimi K2.7 Code 9.9 10.0 100.0% 0 5.39s 669 725 1,232
Resolución de acertijos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.23s 558 241 4,940
Kimi K2.7 Code 5.9 7.7 44.4% 1 41.00s 651 15,438 17,368
Llamada de herramientas Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Gemini 3.5 Flash 9.8 10.0 100.0% 0 4.96s 6,115 265 1,608
Kimi K2.7 Code 3.0 10.0 0.0% 0 0ms 0 0 0
Cultura general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.94s 156 12 2,005
Kimi K2.7 Code 3.0 10.0 0.0% 0 341.76s 210 2,153 40,930

Comparación rápida

Cambiar par de comparación