Google ha presentado oficialmente Géminis 3.1 Flash-Liteuna versión optimizada del modelo que usamos casi todos en la aplicación de Gemini. La nueva IA se posiciona como la opción más rápida y barata de la familia, ofreciendo un rendimiento a la par de otros modelos grandes. Esta versión ya se encuentra en vista previa y pronto se liberará a desarrolladores.
De acuerdo con una publicacion en el blog oficialGemini 3.1 Flash-Lite ha sido diseñado para gestionar volúmenes masivos de datos sin que los desarrolladores se preocupen de los costes. El modelo supera a la versión 2.5 Flash con tiempos de respuesta de hasta 2.5 veces más rápidos. LA reducción en la latencia no afecta la calidad de las respuestas, puesto que son iguales o hasta mejores en algunos casos.
Los datos de rendimiento se sitúan en Gemini 3.1 Flash-Lite con una puntuación Elo de 1432 en el ranking de Arena.ai. En pruebas técnicas, el modelo alcanza un 86,9% en GPQA Diamond y un 76,8% en MMMU Pro. La primera se centra en medir las capacidades de razonamiento profundo en preguntas de nivel expertomientras que la segunda evalúa cómo los modelos procesan texto e imágenes de forma simultánea en problemas de múltiples disciplinas.
Frente a GPT-5 mini, Claude 4.5 Haiku o Grok 4.1 Flash, Gemini 3.1 Flash-Lite brilla en los benchmarks de conocimiento científico, comprensión de videos y razonamiento en diferentes idiomas. Los resultados también indican que, a pesar de ser una versión recortada, mantiene una capacidad de razonamiento que supera a modelos de mayor tamaño.
Una de las funciones que hereda de sus hermanos mayores es el control sobre los niveles de pensamiento. Esto permite a los desarrolladores decidir cuánto esfuerzo de computación dedica el modelo a cada tarea. No es lo mismo pedirle que genere una interfaz de usuario compleja que realice una traducción simple, lo que se convierte en una optimización de los costes operativos.
Gemini 3.1 Flash-Lite: tan bueno como sus hermanos mayores
El salto entre Gemini 3 Flash original y esta nueva versión 3.1 Flash-Lite se nota principalmente en la billetera. El predecesor se lanzó con un precio de 0,50 dólares por millón de tokens de entrada y 3 dólares por los de salida. Con la versión Lite, Google ha cortado esos precios exactamente a la mitad: 0,25 dólares para entrada y 1,50 dólares para salida.

En términos de velocidad, la mejora es medible. Según los benchmarks de Análisis Artificialel 3.1 Flash-Lite es un 45% más rápido generando respuestas que Gemini 2.5 Flash. Si comparamos con el estándar Gemini 3 Flash, que ya era tres veces más veloz que la serie 2.5 Pro, queda claro que Google quiere reducir la fricción para los desarrolladores que necesitan respuestas instantáneas.
Un punto en el que Gemini 3.1 Flash-Lite se queda corto es en la parte de programación. En las pruebas de LiveCodeBench, la IA de Google no es capaz de superar a GPT-5 mini y Grok 4.1 Fast. La nueva versión está enfocada a seguir instrucciones complejas en procesos repetitivospor lo que si buscas un asistente que sea experto en escribir código, aquí no es.
Gemini 3.1 Flash-Lite estará disponible como versión preliminar a través de la API en Google AI Studio y para empresas mediante Vertex AI. Vale la pena mencionar que este modelo está pensado para desarrolladoresmientras que Gemini 3.1 Flash es una versión más equilibrada orientada a los consumidores finales.
