ChatGPT ya puede ver y procesar vídeo en tiempo real: la ciencia ficción se convierte en realidad

ENTRETENIMIENTO

La inteligencia artificial sigue avanzando a pasos agigantados, y una de las últimas innovaciones de OpenAI acerca aún más la ciencia ficción a nuestra realidad. ChatGPT, el popular chatbot, ha adquirido una nueva capacidad: ahora puede procesar vídeo en tiempo real. Esta novedad, que estará disponible en los próximos días, marca un hito en la evolución de los asistentes virtuales, acercándose a las ideas planteadas en películas como Her, donde los asistentes de IA no solo se comunicaban por voz, sino que también “veían” el entorno a través de la cámara.

Esta nueva funcionalidad permitirá a los usuarios interactuar con ChatGPT de una manera aún más avanzada. A partir de su integración con el modelo multimodal GPT-4o, los usuarios podrán permitir que ChatGPT tenga acceso a sus cámaras o incluso compartir la pantalla para que el chatbot procese imágenes en tiempo real. Así, el modelo podrá ofrecer asistencia visual para realizar diversas tareas, como reconocer objetos en una mesa y guiar a una persona en tiempo real en actividades como preparar café o resolver problemas matemáticos.

El proceso para activar esta función será sencillo. Los usuarios solo necesitarán abrir la aplicación de ChatGPT, activar el modo de voz avanzado y, desde allí, seleccionar la cámara del dispositivo para comenzar la interacción visual. Si se usa un teléfono móvil, el sistema permitirá elegir entre la cámara delantera o trasera. Además, al compartir la pantalla, los usuarios podrán permitir que el modelo de IA acceda a las aplicaciones que estén usando, brindando una experiencia más interactiva y personalizada.

Aunque el potencial de este avance es significativo, OpenAI también reconoce que como cualquier modelo de inteligencia artificial, ChatGPT puede cometer errores al procesar las imágenes o al interpretar el entorno. Sin embargo, la compañía ha mostrado cómo el modelo puede ser útil en una variedad de escenarios, como asistir a personas con dificultades visuales mediante descripciones sencillas del entorno, o incluso en actividades de entretenimiento, como jugar a juegos sencillos.

Este nuevo modo de vídeo estará disponible para los usuarios de ChatGPT Plus (20 dólares al mes) y ChatGPT Pro (200 dólares al mes) en la mayoría de los países. Sin embargo, la Unión Europea no será parte del lanzamiento inicial debido a cuestiones regulatorias. OpenAI ha señalado que esta función podría tardar más en llegar a la región, y Sam Altman, CEO de OpenAI, mencionó en un mensaje en la red social X que algunas funcionalidades podrían no estar disponibles para Europa por el momento, ya que la empresa debe cumplir con las normativas locales.

A pesar de los desafíos regulatorios, OpenAI continúa liderando la innovación en inteligencia artificial, acercando cada vez más el concepto de asistentes virtuales que no solo hablan, sino que también interactúan con el mundo visualmente. Esto plantea un futuro en el que los límites de la inteligencia artificial se expanden constantemente, abriendo nuevas posibilidades para su aplicación en diversas áreas, desde la accesibilidad hasta la productividad y el entretenimiento.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *