Desbloquea el poder de la inteligencia visual en tu iPhone para traducir y explorar el mundo que te rodea

En una nueva actualización, la línea iPhone 16 finalmente obtiene Visual Intelligence, una función que te permite recopilar instantáneamente información sobre cualquier cosa que te rodea con solo tomar una foto.

Integrado en el botón Control de cámara en iOS 18.2, lanzado el 11 de diciembre, Visual Intelligence le brinda acceso a servicios de terceros como ChatGPT y Búsqueda de Google para obtener información, lo que simplifica el aprendizaje sobre objetos, puntos de referencia, calificaciones de restaurantes e incluso la raza de perro que encuentra.

A continuación, le explicaremos lo que necesita para comenzar con Visual Intelligence, cómo acceder a sus potentes herramientas y ejemplos prácticos de lo que puede hacer con esta característica innovadora.

  • No te pierdas: la guía completa de funciones de iOS 18.2: aquí tienes todo lo nuevo y mejorado para tu iPhone

Primeros pasos con la inteligencia visual en el iPhone 16

Para utilizar Visual Intelligence, necesitará un iPhone 16, iPhone 16 Plus, iPhone 16 Pro o iPhone 16 Pro Max con iOS 18.2 o posterior. Además, las funciones de Apple Intelligence deben habilitarse a través de Configuración »Apple Intelligence y Siri.

Visual Intelligence está integrado directamente en el botón de control de la cámara, lo que significa que puede acceder a él desde cualquier lugar donde pueda acceder a la interfaz de la cámara.

Para usarlo, mantenga presionado el botón Control de cámara. Si es la primera vez que utiliza Visual Intelligence, Apple mostrará una pantalla de presentación explicando que las imágenes capturadas para análisis no se almacenan en su iPhone ni se comparten con Apple. También obtendrá pantallas de presentación cuando utilice por primera vez las funciones Preguntar y Buscar para ChatGPT y Google, respectivamente, lo que explica que las imágenes capturadas se envían a ChatGPT o Google para su análisis.

Usando la interfaz de inteligencia visual

Una vez que esté en la interfaz de Visual Intelligence, verá tres componentes principales: un botón obturador grande (Capturar), un ícono de burbuja de texto (Preguntar) y un ícono de búsqueda de imágenes (Buscar). Los tres tomarán una fotografía de lo que sea que estés apuntando con la cámara de tu iPhone, pero cada uno tiene su propio propósito, que revisaremos a continuación. Los botones Preguntar y Buscar también aparecerán si el botón Capturar no le brinda ninguna información.

Puede acercar o alejar pellizcando la pantalla o presionando ligeramente el botón Control de cámara. El zoom es la única opción disponible en la superposición de configuración de Control de la cámara, por lo que solo tendrás que presionar el botón una vez ligeramente y luego deslizar el dedo sobre él para ajustar el nivel de zoom.

1. Capturar (obturador)

Toque el botón del obturador para capturar la escena y obtener resultados personalizados de Apple Intelligence. Los resultados variarán dependiendo de lo que hayas capturado. Estas son algunas de las cosas que puede ver en Apple Intelligence:

Lea también:Mejore los colores y aumente el atractivo visual en sencillos pasos

  • Traducir texto
  • Resumir texto
  • Agregar un evento al Calendario
  • Llama a un número de teléfono
  • Visitar un sitio web
  • Ver una ubicación en Maps
  • Leer texto en voz alta
  • pedir comida
  • Ver un menú
  • Ver más opciones

Si Apple Intelligence no puede encontrar nada en la imagen, aún puede usar los botones Preguntar y Buscar para obtener información de ChatGPT y Google, respectivamente, que cubriremos a continuación.

Si obtiene resultados incorrectos de Visual Intelligence, puede "Informar una inquietud" si ve aparecer el botón. También estará disponible en el menú Más (•••).

2. Preguntar (ChatGPT)

Toque el ícono de la burbuja de texto para obtener información detallada de ChatGPT, que ayuda a interpretar escenas complejas e identificar objetos difíciles de reconocer. También sirve como una buena opción de respaldo cuando Apple Intelligence no tiene ninguna respuesta para usted.

Puede tocar el botón Preguntar en la pantalla de captura para tomar una fotografía inmediatamente y pedirle a ChatGPT información al respecto, o puede tocar Preguntar después de capturar una imagen con el botón del obturador, en caso de que primero quiera escuchar la versión de Apple.

Luego verá la respuesta de ChatGPT, que puede copiar a su portapapeles, y la opción "Seguir con ChatGPT" para continuar haciendo preguntas para obtener detalles adicionales. Si no recibe una respuesta automática de ChatGPT, simplemente envíe una pregunta en el campo de seguimiento.

Consejo: si tienes instalada la aplicación ChatGPT, puedes abrir tu interacción en la aplicación para disfrutar de una experiencia más conversacional. La integración de ChatGPT también guarda las interacciones en su cuenta ChatGPT cuando inicia sesión.

Tenga en cuenta que ChatGPT no es perfecto. Como se ve a continuación, quería saber el artista detrás de una pintura capturada, y identificó incorrectamente al artista y el título de la obra de arte. Envié la respuesta correcta en un formulario de comentarios, luego intenté nuevamente más de tres semanas después y obtuve una respuesta diferente que también era completamente incorrecta.

3. Buscar (Google)

Toque el ícono de búsqueda de imágenes para ver las imágenes coincidentes encontradas en la Búsqueda de Google, lo que ayuda a identificar un producto, lugar u otros elementos visibles específicos. Al igual que el botón Preguntar, la opción Buscar sirve como una buena opción de respaldo cuando Apple Intelligence no tiene ninguna respuesta para usted.

Puede tocar el botón Buscar en la pantalla de captura para tomar una fotografía inmediatamente y pedirle a la Búsqueda de Google que muestre imágenes similares. Alternativamente, puede tocar Buscar después de capturar una foto con el botón del obturador para ver primero los resultados de Apple.

Luego verá una ventana que muestra una selección de imágenes extraídas de la Búsqueda de imágenes de Google, que puede desplazarse o abrir en una vista web para explorar en detalle.

Si obtiene coincidencias de imágenes incorrectas de Google, puede "Informar una inquietud" para enviar comentarios.

Ejemplos prácticos de inteligencia visual en acción

A continuación se muestran algunos escenarios del mundo real en los que la Inteligencia Visual puede resultar útil:

  • Explorando restaurantes locales:Apunta tu cámara a un restaurante mientras caminas por la calle. Visual Intelligence puede mostrar calificaciones de clientes, reseñas, menús, enlaces de pedidos e incluso horas de operación.
  • Traducir texto sobre la marcha:Cuando viaja, puede utilizar Visual Intelligence para traducir carteles, menús u otro texto de un idioma a otro.
  • Agregar detalles del evento al instante:Tome una foto del folleto de un evento y Visual Intelligence le permitirá crear un evento de calendario a partir de los detalles que captura.
  • Aprender sobre plantas, animales y objetos:Tome una fotografía de una planta o animal único y Visual Intelligence puede usar ChatGPT o Google para ayudarlo a identificarlo.
  • Identificación de obras de arte y pinturas:Si está viendo una obra de arte en un museo, mantenga presionado el botón Control de cámara, toque Preguntar y Visual Intelligence usará ChatGPT para identificar al artista y la obra (aunque, como se vio arriba, es posible que los resultados no sean perfectos siempre).
  • Obteniendo respuestas prácticas:¿Necesita ayuda para identificar la raza de un perro o el tipo de árbol en un parque? ChatGPT de Visual Intelligence puede analizar la imagen y proporcionar información.
  • Encontrar dónde comprar productos:Si ve un artículo que le gusta en una tienda, tome una foto rápida con Visual Intelligence y utilice la Búsqueda de Google para encontrar minoristas en línea.
  • Identificación de monumentos famosos:Tome una foto de un punto de referencia y Visual Intelligence puede mostrarle su ubicación en el mapa, dirección, reseñas y otros datos, y al utilizar la Búsqueda de Google le mostrará imágenes y detalles similares.
  • Ayudando con la accesibilidad:Capture una imagen para obtener una traducción, resuma el contenido para facilitar la lectura, haga que le diga el texto capturado y más.

Consejos para utilizar la inteligencia visual con éxito

  • Según Apple, "la información sobre lugares de interés estará disponible en los EE. UU. para empezar, con soporte para regiones adicionales en los próximos meses".
  • Visual Intelligence está disponible automáticamente en dispositivos compatibles, pero puede requerir permiso para acceder a ChatGPT o Búsqueda de Google. Asegúrese de que sus ajustes estén configurados para una experiencia perfecta.
  • Cuando utilice ChatGPT, no dude en hacer preguntas de seguimiento si la respuesta inicial está incompleta o no está clara.
  • Visual Intelligence no almacena ni comparte las imágenes capturadas con Apple.
  • Si recibe información inexacta, envíe comentarios a Apple, Google o ChatGPT directamente en la interfaz para ayudar a entrenar sus modelos.

Visual Intelligence en la línea iPhone 16 brinda a los usuarios un nuevo nivel de flexibilidad y acceso a la información. Ya sea que esté explorando su entorno, buscando información de productos o identificando objetos, esta herramienta abre nuevas posibilidades para la interacción en el mundo real y la inteligencia digital mientras viaja. Al aprovechar servicios como ChatGPT y Google Search, Visual Intelligence de Apple ofrece una poderosa combinación de privacidad, control e información inmediata, todo en la palma de su mano.

Foto de portada y capturas de pantalla de Shutterstock