Contenido:
Lo que necesitas saber de este tema
- Gemini Live es un impresionante asistente digital con modo de voz, 10 voces diferentes, respuestas rápidas a los diálogos y transcripciones de chat.
- Desafortunadamente, sus respuestas se ven obstaculizadas por el modelo de IA subyacente. El discurso de Gemini Live también puede ser demasiado formal y sus respuestas parecen simplificadas.
- Confiar en Gemini Live es una tontería. Peor aún, pagar 20 dólares por ello.
Disponible con la suscripción Gemini Advanced, Gemini Live se ha convertido en la función de la que más se habla desde su presentación en el evento Made by Google 2024, lo que hace que incluso el lanzamiento del Pixel 9 sea una nota a pie de página. Pero las primeras críticas, aunque inicialmente impresionantes, no la favorecieron.
Entonces, como la mayoría de los críticos de tecnología, decidí probar Gemini Live y ver qué diablos era. En aras de la brevedad, no les contaré todo de lo que hablé (¿quién tiene tiempo?). Pero entenderás la idea general.
Gemini Live es un asistente digital avanzado que carece de modelo de inteligencia artificial
Ahora bien, Gemini Live no es gratuito y no tengo un Pixel 9, que viene con una suscripción gratuita de un año a Gemini Advanced. Así que obtuve una prueba gratuita y Gemini Live estuvo disponible para mí de inmediato, lo cual es genial.
¡Eso es todo!
¿Pero vale la pena la suscripción de $20 a Gemini Live? Averigüemos.
¿Qué tiene de bueno Gemini Live?
Gemini Live viene con 10 voces y puedes seleccionar fácilmente la tuya en la configuración de Gemini. Pero tenga en cuenta que Google requiere que establezca el inglés (EE. UU.) como idioma predeterminado para poder hacer esto, lo cual es un requisito inútil. Quiero decir que hay una voz británica (Capella) aquí mismo.
¿Me están engañando mis ojos?
En cualquier caso, hay votos suficientes para todos los días de la semana, e incluso más.
Mis primeras impresiones de Gemini Live, como las de todos los demás, fueron positivas. Teniendo en cuenta las voces sintéticas y forzadas de Google en el pasado, Gemini Live es un soplo de aire fresco. Sin embargo, las voces son un poco formales: no escucharás muchos «umms» y «ahs» (y otras interjecciones). Debido a esta y otras razones subconscientes, encontré las voces un poco impasibles y reservadas, presumiblemente para evitar que los usuarios formen vínculos emocionales, algo que OpenAI teme que pueda ser el caso en el modo de voz propio de ChatGPT, que es mucho mejor de todos modos.
Las respuestas llegan rápidamente, por lo que realmente se siente como si estuvieras hablando con un amigo por teléfono. Pero a diferencia de un amigo cuyas historias nunca terminan, puedes interrumpir a Géminis en cualquier momento. Quizás ya lo sabías. Pero aun así vale la pena mencionarlo porque puedes decirle que se vaya a la mierda si comienza a decir algo que sabes que no es cierto (más sobre esto más adelante).
Una vez que finalice la llamada, verá una transcripción lista y disponible para leer. Para mí esta es una de las mejores características. Realmente ayuda probar cómo se ve una conversación en texto y compartirla con otros.
Espacio para mejorar
Hay algunas cosas que Gemini Live hace bien. Pero también tiene mucho potencial sin explotar.
En primer lugar, las conversaciones con Gemini Live son, sin duda, breves. Cuando haces una pregunta, Gemini Live responde lo más brevemente posible, como si estuviera ocupado atendiendo a otras personas. No lo verás hablándote casualmente o escupiendo, lo que mucha gente piensa que es algo bueno. Pero, ¿pueden presentarse todas las ideas de forma sencilla y directa, a pesar de la navaja de Occam?
Por ejemplo, le pedí que comparara a Pegaso (ya que usaba esa voz) con Ícaro (ambos son parte de los mitos griegos). Si bien hay varios nodos de comparación, Gemini Live me dio respuestas breves y directas. Traje a Hanuman (del mito hindú) para darle un ángulo diferente de comparación. Una vez más, no más que unas pocas frases. Todo se volvió molesto.
Después de numerosos intentos de lograr que hablara más, le pregunté si había alguna configuración que me permitiera regular su verbosidad. Me dijo que no podía cambiarlo, pero con mucha autoridad me dio instrucciones sobre cómo podía hacerlo yo mismo, las cuales seguí tontamente porque no existe tal configuración.
¿Qué? ¿Dónde?
Lo que me lleva a…
¿Dónde está sufriendo?
La tendencia de Géminis a inventar cosas y alucinar no ayudó precisamente a aumentar la confianza del usuario. También ha atraído muchas críticas por sus errores de generación de imágenes en el pasado. Es lamentable que a pesar de que la modalidad ha cambiado y el modelo base se ha actualizado a Gemini 1.5 Flash, el problema sigue prevaleciendo en Gemini Live.
Si bien la mayoría de sus respuestas se basan en información objetiva, de vez en cuando genera una respuesta de la nada.
Por supuesto, se puede argumentar que darle voz a la IA infunde más confianza en los usuarios. Y con las voces humanas es mucho más fácil confiar en él y sucumbir a la confianza con la que se dan las respuestas. Pero si no tienes cuidado o no revisas las respuestas cuestionables, podrías terminar siendo estafado como lo hice yo.
La tecnología avanza más rápido de lo que nadie esperaba, pero los chatbots son tan susceptibles a las alucinaciones como siempre. Por lo tanto, incluso conociendo la propensión de la IA a proporcionar mala información, si continúas confiando ciegamente en ella, es posible que no necesites la inteligencia artificial.
Repite esto conmigo: si me engañas una vez, la culpa es tuya; Si me engañas dos veces, la culpa es mía.
¿En qué se diferencia Gemini Live del modo de voz avanzado ChatGPT?
Ahora miremos al elefante en la habitación. ¿Cómo se compara Gemini Live con el modo de voz avanzado de ChatGPT? En verdad, Gemini Live simplemente no es tan detallado, atractivo o entretenido como el modo de voz de ChatGPT. Si bien este último puede haber sido demasiado entretenido (incluso coqueto) y inquietantemente humano, con todos sus sonidos y gestos inquietantes, al menos sirve como una herramienta de entretenimiento. Gemini Live, por el contrario, se toma demasiado en serio a sí mismo, lo que puede no jugar a su favor, sobre todo porque sus respuestas se ven obstaculizadas por su modelo de inteligencia artificial.
Pero quizás la mayor diferencia entre los dos es la siguiente: Gemini Live interpreta la voz como texto y luego responde, mientras que el modo de voz de ChatGPT procesa la voz directamente.
Veredicto
Gemini Live es una gran herramienta y un claro paso adelante con respecto al antiguo Asistente de Google. La posibilidad de llamarlo desde la pantalla de bloqueo es conveniente y 10 voces son suficientes. Pero sería una locura confiar en él con fines profesionales. Personalmente, prefiero donar mi dinero a una organización benéfica de la que no sé nada que pagar 20 dólares sólo por Gemini Live. Afortunadamente, la suscripción Gemini Advanced también tiene otros beneficios.
Tal como están las cosas ahora, es bueno ver a la IA, independientemente de su modalidad, como un esquizofrénico en recuperación. Está mejorando, pero todavía es propenso a recaer. La única diferencia es que no tienes un esquizofrénico en el bolsillo y no pagarás por ello.
¿Qué opinas de Géminis en Vivo? ¿Crees que Google cerrará esta crítica tan favorable? Háganos saber en los comentarios a continuación.