Google inició la carrera por el desarrollo de chatbots de inteligencia artificial (IA) a un paso más lento que su rival OpenAI, pero las distancias se han estado acortando.
El gigante tecnológico lanzó en mayo una versión mejorada de su plataforma, Bard, en un esfuerzo por ofrecer a los usuarios funciones que tiene ChatGPT-4, e incluso algunas mejores.
Una de las principales actualizaciones fue la anunciada este jueves: la plataforma de Google ya está disponible en español y otras cuatro decenas de idiomas. Hasta antes de esto, los usuarios solo podían escribir comandos en inglés, japonés y coreano.
Con esto, las diferencias entre ambos sistemas aún son perceptibles, pero los expertos consideran que la carrera se está igualando.
“En estos momentos ChatGPT-4 tiene clara ventaja. Bard está llegando como un retador, no como un líder”, considera Ricardo Carreón, director de tecnología de Hexabit, una firma de IA con sede en Texas, EE.UU.
“Pero se va a acercar y va a ser una competencia real entre las plataformas. El asunto será cómo evoluciona la base de usuarios en ambas. A fin de cuentas lo que está en juego es quién va a tener más usuarios“, señala Carreón a BBC Mundo.
“A medida que continuamos desarrollando Bard de manera responsable, estamos ampliando gradualmente el acceso a más países y regiones en inglés. Continuaremos implementándolo con el tiempo”, le dijo una fuente de Google a BBC Mundo, sin especificar fechas.
Por el contrario, una ventaja que tiene frente a ChatGPT-4 es que este último es una versión de pago (US$20), mientras que el chatbot de Google es de uso gratuito.
Fuera de eso, ¿qué tan cerca o lejos están las nuevas funciones de Bard respecto a ChatGPT-4?
Hasta hace unos meses, la interacción con los chatbots de Google y OpenAI estaba limitada al texto.
En una era en la que internet privilegia lo visual, esto en apariencia no encajaba. Pero OpenAI rompió la barrera al presentar ChatGPT-4 en marzo con la integración de imágenes a su chatbot.
Bard ha igualado esa función en su nueva versión, algo con que acelera el ritmo de la competencia.
La función más básica es la de recibir instrucciones basadas en una imagen. Por ejemplo, puedes preguntarle dónde está ubicada esa obra de arte que alguien compartió en Instagram sin mencionar el origen.
Por otro lado está la oferta de respuestas en imágenes. Con ello, por ejemplo, podrías pedirle que te presente fotos de los cuadros más visitados en el Museo de Louvre en París y obtendrás la respuesta con texto y fotos en segundos.
Pero lo innovador de la IA va más allá: “No es solamente buscar una foto, es leer qué hay en la foto y en base a eso poder ejecutar una cierta acción”, explica Carreón.
“Si tengo en la mesa huevos, tomate, cebolla y le pregunto ‘¿qué puedo hacer?’, me puede sugerir unos huevos a la mexicana y mostrar la receta con esos ingredientes. Entonces ya reconoce lo que hay en la foto y va más allá de buscar imágenes similares. Es entender qué hay en ellas“.
Esta capacidad se llama “función multimodal”: que en lugar de dar instrucciones al chatbot solo en texto, este sea capaz de entender también imágenes.
“Ya sea que quieras más información sobre una imagen o necesites inspiración para el texto de la imagen, como una nota de agradecimiento para un regalo, ahora puedes cargar imágenes con prompts y Bard analizará la foto para ayudarte. Esta función está disponible en inglés y pronto se expandirá a nuevos idiomas”, explicaron los responsables de Bard este jueves.
Otra función anunciada en mayo, pero no disponible aún, es la generación de imágenes mediante IA de Adobe. Cuando sea lanzada, podrías pedir que cree la imagen con la combinación de elementos que le indiques.
¿Una foto de tu mascota con un gorrito de cumpleaños? Es algo que podrías pedirle.
Google dice que en este aspecto se encuentran en fase de experimentación todavía. “Queremos implementarla de manera gradual y responsable”, señaló la fuente consultada.
Sería un gran avance sobre ChatGPT-4, que no ha revelado planes para una función similar.
Contar con la información que ofrecen los chatbots de IA es un primer paso, pero ¿qué sigue?
En la nueva versión de Bard, Google ahora ofrece una “salida” directa de esa información a su nube de servicios.
Puedes llevar directamente el contenido a tu correo de Gmail si le pides que escriba una petición de vacaciones para tu jefe. O al servicio de Docs si le pediste que compusiera una canción para tu papá.
El chatbot de OpenAI solo ofrece un botón para copiar el contenido en el portapapeles.
“A fin de cuentas está el mundo Google peleando con el mundo Microsoft con ChatGPT-4. Ya lo ha anunciado también como el copiloto en el email, en Office, para los programadores en GitHub, va a ser tu copiloto inclusive en Windows”, advierte Carreón.
“Entonces en ciertas funciones de Windows vas a poder recurrir a un asistente de inteligencia artificial para hacer ciertas tareas dentro del sistema operativo”, añade.
Lo que en realidad se espera de la industria de IA no solo es crear chatbots, sino adaptar esa enorme capacidad de procesamiento de información y aprendizaje a otras aplicaciones de uso cotidiano o especializado.
“Con una aplicación de reservas en restaurantes, al integrar inteligencia ya puedes decirle en el chat que te recomiende un lugar que sea vegano, que esté abierto en la noche hasta las 00:00. Te da la lista y le dices dónde quieres reservar”, apunta Carreón.
Tanto Google como algunos expertos han destacado las capacidades mejoradas de razonamiento matemático o la codificación en más de 20 lenguajes de programación que ofrece la nueva versión de Bard.
Pero esto solo es percibido por los profesionales en esas áreas.
Sin embargo, una función adicional de Bard que ha sido destacada para el uso del usuario regular es la del enlistamiento de fuentes que ahora ya hace el chatbot de Google.
La IA ha despertado preocupación por las “alucinaciones” que llegan a presentar estos chatbots. Se llama así a la información errónea, inexacta o con deficiencias que producen a partir de sus enormes bancos de datos y su capacidad propia de producirla con base en aprendizaje.
Bard ahora despliega las múltiples fuentes de las cuales extrajo información, algo que ChatGPT no hace. Esto ayuda a crear confianza en los resultados, que pueden ser verificables.
Para Carreón, esto es valioso, pero advierte que hay que tener cautelay tener unjuicio crítico sobre lo que el chatbot presenta.
“La IA accede a información de su cúmulo de datos. Pero también es cierto que genera información, porque como el modelo aprende. Va a haber cierta información que no proviene de un lugar en particular”, explica.
“Si para un problema ya aprendió que hay una buena solución, no necesariamente te va a dar links. Pero como todavía en estos programas hay cierto error, es muy importante que todas las personas que utilizan la IA verifiquen el resultado final, porque a veces tiene errores”.
Para el experto de Hexabit, los usuarios deberían tener claro que la IA no es un mero buscador de información.
El objetivo de los desarrolladores ha sido crear una herramienta con capacidad de imitar el aprendizaje y razonamiento humanos.
“Como dice Bill Gates, es probable que la búsqueda como la conocemos hoy en día desaparezca. Y eso tiene implicaciones gigantes, no solo en Google, sino en todos los publicadores de contenidos que utilizan a Google como su principal plataforma de tráfico”, expone.
“Creo que muchas personas no se dan cuenta todavía de que esto va a cambiar todo, pero de una manera brutal. Y ya está pasando, ya hay muchas cosas que están cambiando”.