OpenAI actualiza su modelo de lenguaje para percibir comandos de voz e imgenes y contestar con voz en vez de texto
ChatGPT se ha transformado en menos de un ao en la herramienta de inteligencia artificial ms famosa del planeta. Con cientos y cientos de millones de usuarios registrados, este chatbot, desarrollado por OpenAI, puede contestar cualquier pregunta formulada en lenguaje natural o inventar textos desde unas pocas indicaciones utilizando cualquier estilo imaginable.
Pero, desde este momento, ser capaz tambin de hablar, percibir y ver. La ltima versin de la herramienta, tanto en su versin web como en las aplicaciones para dispositivos mviles, aade la posibilidad de usar imgenes y voz para elaborar las distintas preguntas.
ChatGPT, adems, podr desde este momento dar contestaciones no slo como un bloque de texto sino más bien en voz alta, usando 5 voces creadas, cmo no, con inteligencia artificial. Esto permitir, por vez primera, mantener una conversacin natural con este modelo largo de lenguaje -que es como se conoce la tecnologa que vuelve posible a ChatGPT crear contestaciones que semejan escritas por una persona-.
Es, eso s, una experiencia bastante ms lenta que charlar con una persona real. La contestación a una pregunta puede llegar tras múltiples segundos de incmodo silencio, de forma semejante a lo que sucede con las contestaciones de texto.
Gracias a estas nuevas habilidades, no obstante, desde este momento ser posible utilizar CHatGPT en una mayor pluralidad de situaciones. La aplicacin, por servirnos de un ejemplo, podr identificar las distintas unas partes de una bici en una imagen, y asistir al dueo a ajustar o reparar algo que se haya roto. Tambin podr comentar los diversos puntos de inters de un paisaje o recomendar diferentes recetas tan slo examinando una fotografía de lo que hay dentro del frigorfico.
Las nuevas funciones estn por el momento limitadas a un pequeo conjunto de usuarios y son exclusivas de quienes pagan por el servicio ChatGPT Plus o la versin para empresas de la aplicacin. Segn la compaa, el acceso se ir ampliando en las prximas semanas entre los subscritores, si bien herramientas como las voces sintticas estarn libres en un primer instante slo en ingls.
Estas nuevas funciones tambin permitirn a terceras ofrecer nuevos servicios. Spotify, por servirnos de un ejemplo, termina de iniciar la prueba conduzco de un servicio de traduccin instantnea de podcasts usando la propia voz de los comunicadores.
Desde la compañía, no obstante, sealan que estas nuevas formas de interaccin no mejoran necesariamente la confiabilidad de las repuestas, uno de los inconvenientes de este género de herramientas, ya que pueden, a veces, inventarse los datos que no conoce para dar congruencia al texto final. «Somos transparentes sobre las limitaciones del modelo y desaconsejamos el uso de mayor riesgo, como la informacin especializada, sin una verificacin adicional», explican desde OpenAI.