Google Dllows Gemini 2.5 Flash con un «presupuesto de pensamiento» ajustable y 24,576 token.


Que saber

  • Google lanzó Gemini 2.5 Flash, un nuevo modelo de inteligencia artificial, disponible en la visualización preliminar para los desarrolladores.
  • Los desarrolladores pueden establecer un «presupuesto de pensamiento», una restricción en el número de tokens, que el modelo utiliza para razonamiento ajustable a 24,576 tokens.
  • El modelo equilibra la velocidad, el costo y la calidad del razonamiento, corrigiendo automáticamente la profundidad de pensamiento en función de la complejidad de la tarea si no se establece el presupuesto.
  • Flash Gemini 2.5 está disponible a través de API Gemini, Google AI Studio y Vertex AI, y está diseñado para tareas con un punto alto con un bajo retraso.

Google introdujo Gemini 2.5 Flash, la última adición a su familia Gemini AI, ahora está disponible en la visualización preliminar para los desarrolladores. Este modelo se distingue al ofrecer una función única llamada «Presupuesto de pensamiento», que le permite controlar el número máximo de tokens que el modelo puede usar para el razonamiento interno.

Puede establecer este presupuesto en cualquier lugar de 0 a 24,576 tokens, proporcionándole un control de granos grados sobre el compromiso, la velocidad y el costo.

Si establece el presupuesto de pensamiento para cero, Gemini 2.5 Flash da la prioridad de la velocidad y el costo, comportándose como una versión más rápida de su predecesor, 2.0 Flash. Cuando aumenta el presupuesto, el modelo pasa más tiempo, lo que puede mejorar la calidad de las respuestas para tareas complejas de múltiples etapas.

Sin embargo, el modelo está destinado a efectividad: utiliza solo tantos presupuestos como es necesario para la complejidad de su pista. Para consultas simples, responde rápidamente sin un procesamiento innecesario.

Esta flexibilidad es especialmente útil para los desarrolladores que necesitan optimizar para diversas opciones de uso. Por ejemplo, las preguntas o transferencias simples requieren un razonamiento mínimo, mientras que los problemas más complejos, como tareas avanzadas en matemáticas o programación, se benefician de un presupuesto de pensamiento más alto.

El modelo corrige automáticamente la profundidad del razonamiento si no indica el presupuesto, evaluando cada solicitud de complejidad.

Flash Gemini 2.5 está disponible a través de API Gemini, Google AI Studio y Vertex AI.

Apoya los consejos del texto, las imágenes, el video y el audio, y también tiene una ventana de contexto para un millón. Google enfatiza que este modelo proporciona un fuerte rendimiento en sugerencias difíciles, ocupando un modelo 2.5 Pro más avanzado.

¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)
Compártelo!

Deja un comentario