OpenAI presentó ChatGPT-4o: Funcionamiento del nuevo modelo de Inteligencia Artificial gratuito

La compañía ha desarrollado nuevas capacidades en producción y comprensión de textos, imágenes y sonidos. Además, ahora es capaz de detectar y analizar las emociones en los rostros mediante la cámara de un teléfono inteligente.

Los ejecutivos de OpenAI demostraron cómo ChatGPT puede ser utilizado en diversas situaciones: desde recibir instrucciones en tiempo real para resolver problemas matemáticos hasta contar historias antes de dormir y ofrecer consejos de codificación. ChatGPT mostró la capacidad de hablar con una voz natural y humana, así como con una voz de robot, e incluso entonó parte de una respuesta. Además, la herramienta fue capaz de analizar una imagen de un gráfico y discutir sus detalles.

Se destacó que el modelo puede detectar las emociones de los usuarios; en una ocasión, al escuchar la respiración agitada de un ejecutivo, ChatGPT lo alentó a calmarse, bromeando: «¡No eres una aspiradora!», en la voz femenina que suena similar a la compañera digital de la película «Her» con voz de Scarlett Johansson.

ChatGPT también demostró su capacidad de mantener conversaciones en varios idiomas, traduciendo y respondiendo automáticamente. Se informó que la herramienta ahora es compatible con más de 50 idiomas, según OpenAI.

Sam Altman, CEO de OpenAI, elogió el nuevo modo de voz (y video) como la mejor interfaz de computadora que ha utilizado, describiéndola como similar a la IA vista en las películas y expresando su asombro por su nivel de realismo y capacidad de respuesta.

OpenAI planea lanzar una aplicación de escritorio ChatGPT con las capacidades del modelo GPT-4o, proporcionando a los usuarios otra plataforma para interactuar con la tecnología de la compañía. Además, GPT-4o estará disponible para desarrolladores interesados en crear sus propios chatbots personalizados a través de la tienda GPT de OpenAI, con la posibilidad de acceso para usuarios no pagos.

Las actualizaciones tecnológicas se implementarán en ChatGPT en los próximos meses, con usuarios gratuitos teniendo un límite en las interacciones con el nuevo modelo GPT-4o antes de regresar automáticamente al modelo anterior GPT-3.5. Los usuarios de pago tendrán acceso a más interacciones con el último modelo.

OpenAI espera que estas mejoras impulsen la adopción de su tecnología, especialmente al ofrecer experiencias actualizadas y capacidades de interacción más amplias, incluyendo conversaciones de voz mejoradas. Esto ocurre en un contexto donde otras grandes empresas tecnológicas también están integrando IA en productos de consumo ampliamente utilizados, lo que podría hacer que estas tecnologías sean más accesibles y comunes para un público más amplio.

Las innovaciones del nuevo ChatGPT-4o incluyen:

  1. Transcripción, Inteligencia y Modo Vocal: Combina la capacidad de transcripción, inteligencia y habilidad para hablar, lo que aporta un modo vocal a la herramienta.
  2. Interacción Fluida en Conversaciones: Reproduce de manera sorprendente discusiones entre humanos, permitiendo interacciones fluidas y naturales.
  3. Detección de Emociones: Es capaz de leer las emociones en los rostros de los usuarios a través de la cámara de su teléfono inteligente.
  4. Guía en Diversas Actividades: Puede guiar a los usuarios en ejercicios de respiración, contar historias o ayudarlos a resolver problemas matemáticos, entre otras actividades.
  5. Nueva Interfaz Conversacional: Ofrece una interfaz más sencilla y conversacional para una mejor experiencia de usuario.
  6. Atajos de Teclado para Preguntas: Permite a los usuarios preguntar cualquier cosa utilizando simplemente atajos de teclado, facilitando la interacción y el acceso a la información.

Así fue la presentación de ChatGPT-4o

Source Open AI CNN