Libérez la puissance de l’intelligence visuelle sur votre iPhone pour traduire et explorer le monde qui vous entoure

Dans une nouvelle mise à jour, la gamme iPhone 16 bénéficie enfin de l'intelligence visuelle, une fonctionnalité qui vous permet de recueillir instantanément des informations sur tout ce qui vous entoure simplement en prenant une photo.

Intégré au bouton de contrôle de la caméra sur iOS 18.2, publié le 11 décembre, Visual Intelligence vous donne accès à des services tiers tels que ChatGPT et Google Search pour obtenir des informations, ce qui facilite l'apprentissage des objets, des monuments, des évaluations des restaurants et même de la race d'un chien que vous rencontrez.

Ci-dessous, nous vous expliquerons ce dont vous avez besoin pour démarrer avec l'intelligence visuelle, comment accéder à ses outils puissants et des exemples pratiques de ce que vous pouvez faire avec cette fonctionnalité révolutionnaire.

  • Ne manquez pas : le guide complet des fonctionnalités d'iOS 18.2 – Voici tout ce qui est nouveau et amélioré pour votre iPhone

Premiers pas avec l'intelligence visuelle sur iPhone 16

Pour utiliser Visual Intelligence, vous aurez besoin d’un iPhone 16, iPhone 16 Plus, iPhone 16 Pro ou iPhone 16 Pro Max exécutant iOS 18.2 ou version ultérieure. De plus, les fonctionnalités Apple Intelligence doivent être activées via Paramètres »Apple Intelligence & Siri.

L'intelligence visuelle est intégrée directement au bouton de contrôle de la caméra, ce qui signifie que vous pouvez y accéder depuis n'importe quel endroit où vous pouvez accéder à l'interface de la caméra.

Pour l'utiliser, maintenez enfoncé le bouton de contrôle de la caméra. Si c'est la première fois que vous utilisez Visual Intelligence, Apple affichera un écran de démarrage expliquant que les images capturées pour analyse ne sont pas stockées sur votre iPhone ni partagées avec Apple. Vous obtiendrez également des écrans de démarrage lors de la première utilisation des fonctionnalités Ask et Search pour ChatGPT et Google, respectivement, ce qui explique que les images capturées sont envoyées à ChatGPT ou Google pour analyse.

Utiliser l'interface d'intelligence visuelle

Une fois que vous êtes dans l'interface Visual Intelligence, vous verrez trois composants principaux : un grand bouton d'obturateur (Capture), une icône de bulle de texte (Demander) et une icône de recherche d'image (Rechercher). Tous les trois prendront une photo de ce vers quoi vous pointez l’appareil photo de votre iPhone, mais chacun a son propre objectif, que nous examinerons ci-dessous. Les boutons Demander et Rechercher apparaîtront également si le bouton Capturer ne vous donne aucune information.

Vous pouvez effectuer un zoom avant ou arrière en pinçant l'écran ou en appuyant légèrement sur le bouton de contrôle de la caméra. Le zoom est la seule option disponible dans la superposition des paramètres de contrôle de la caméra, vous n'aurez donc qu'à appuyer légèrement une fois sur le bouton, puis à faire glisser votre doigt dessus pour régler le niveau de zoom.

1. Capturer (obturateur)

Appuyez sur le bouton de l'obturateur pour capturer la scène et obtenir des résultats personnalisés grâce à Apple Intelligence. Les résultats varieront en fonction de ce que vous avez capturé. Voici quelques éléments que vous pourriez voir grâce à Apple Intelligence :

A lire aussi :Améliorez les couleurs et renforcez l'attrait visuel en quelques étapes simples

  • Traduire le texte
  • Résumer le texte
  • Ajouter un événement au calendrier
  • Appeler un numéro de téléphone
  • Visiter un site Web
  • Afficher un emplacement dans Maps
  • Lire le texte à haute voix
  • Commander de la nourriture
  • Afficher un menu
  • Afficher plus d'options

Si Apple Intelligence ne trouve rien dans l'image, vous pouvez toujours utiliser les boutons Demander et Rechercher pour obtenir des informations de ChatGPT et de Google, respectivement, que nous aborderons ci-dessous.

Si vous obtenez des résultats incorrects de Visual Intelligence, vous pouvez « Signaler un problème » si le bouton apparaît. Il sera également disponible dans le menu Plus (•••).

2. Demandez (ChatGPT)

Appuyez sur l'icône de bulle de texte pour obtenir des informations détaillées de ChatGPT, qui permet d'interpréter des scènes complexes et d'identifier les objets difficiles à reconnaître. Il constitue également une bonne option de sauvegarde lorsque Apple Intelligence lui-même n’a aucune réponse à vous donner.

Vous pouvez appuyer sur le bouton Demander depuis l'écran de capture pour prendre immédiatement une photo et demander à ChatGPT des informations à ce sujet, ou vous pouvez appuyer sur Demander après avoir capturé une image avec le bouton de l'obturateur, au cas où vous souhaiteriez d'abord entendre le point de vue d'Apple.

Vous verrez alors la réponse de ChatGPT, que vous pouvez copier dans votre presse-papiers, ainsi qu'une option « Suivi avec ChatGPT » pour continuer à poser des questions et obtenir des détails supplémentaires. Si vous n'obtenez pas de réponse automatique de ChatGPT, soumettez simplement une question dans le champ de suivi.

Astuce : Si l'application ChatGPT est installée, vous pouvez ouvrir votre interaction dans l'application pour une expérience plus conversationnelle. L'intégration ChatGPT enregistre également les interactions dans votre compte ChatGPT lorsque vous êtes connecté.

Notez que ChatGPT n'est pas parfait. Comme on le voit ci-dessous, je voulais connaître l’artiste derrière un tableau capturé, et le titre de l’artiste et de l’œuvre d’art était incorrectement identifié. J'ai soumis la bonne réponse dans un formulaire de commentaires, puis j'ai réessayé plus de trois semaines plus tard et j'ai obtenu une réponse différente qui était également complètement fausse.

3. Recherche (Google)

Appuyez sur l'icône de recherche d'images pour voir les images correspondantes trouvées dans la recherche Google, ce qui permet d'identifier un produit, un lieu ou d'autres éléments visibles spécifiques. Comme le bouton Demander, l’option Rechercher constitue une bonne option de sauvegarde lorsque Apple Intelligence elle-même n’a aucune réponse pour vous.

Vous pouvez appuyer sur le bouton Rechercher depuis l'écran de capture pour prendre immédiatement une photo et demander à la recherche Google d'afficher des images similaires. Vous pouvez également appuyer sur Rechercher après avoir pris une photo avec le déclencheur pour voir en premier les résultats d’Apple.

Vous verrez alors une fenêtre affichant une sélection d'images extraites de Google Image Search, que vous pouvez faire défiler ou ouvrir dans une vue Web pour explorer en détail.

Si vous obtenez des correspondances d'images incorrectes de la part de Google, vous pouvez « Signaler un problème » pour nous faire part de vos commentaires.

Exemples pratiques d'intelligence visuelle en action

Voici quelques scénarios réels dans lesquels l’intelligence visuelle peut s’avérer utile :

  • Explorer les restaurants locaux :Pointez votre appareil photo vers un restaurant en marchant dans la rue. L'intelligence visuelle peut afficher les évaluations des clients, les avis, les menus, les liens de commande et même les heures d'ouverture.
  • Traduire du texte en déplacement :Lorsque vous voyagez, vous pouvez utiliser l'intelligence visuelle pour traduire des panneaux, des menus ou tout autre texte d'une langue à une autre.
  • Ajout instantané des détails de l'événement :Prenez une photo d'un dépliant d'événement et Visual Intelligence vous permettra de créer un événement de calendrier à partir des détails qu'il capture.
  • En savoir plus sur les plantes, les animaux et les objets :Prenez une photo d'une plante ou d'un animal unique et l'intelligence visuelle peut utiliser ChatGPT ou Google pour vous aider à l'identifier.
  • Identifier des œuvres d’art et des peintures :Si vous regardez une œuvre d'art dans un musée, maintenez le bouton Contrôle de la caméra enfoncé, appuyez sur Demander et Visual Intelligence utilisera ChatGPT pour identifier l'artiste et l'œuvre (bien que, comme vu ci-dessus, les résultats ne soient pas parfaits à chaque fois).
  • Obtenir des réponses pratiques :Besoin d’aide pour identifier la race d’un chien ou le type d’arbre dans un parc ? ChatGPT de Visual Intelligence peut analyser l'image et fournir un aperçu.
  • Trouver où acheter des produits :Si vous repérez un article que vous aimez dans un magasin, prenez une photo rapide avec l'intelligence visuelle et utilisez la recherche Google pour trouver des détaillants en ligne.
  • Identifier des monuments célèbres :Prenez une photo d'un point de repère et l'intelligence visuelle peut vous montrer son emplacement sur la carte, son adresse, ses avis et d'autres données, et l'utilisation de la recherche Google affichera des images et des détails similaires.
  • Aide à l'accessibilité :Capturez une image pour obtenir une traduction, résumez le contenu pour une lecture plus facile, faites-lui parler le texte capturé, et bien plus encore.

Conseils pour utiliser l’intelligence visuelle avec succès

  • Selon Apple, « les informations sur les lieux d’intérêt seront disponibles dans un premier temps aux États-Unis, avec une prise en charge dans d’autres régions dans les mois à venir ».
  • Visual Intelligence est automatiquement disponible sur les appareils pris en charge mais peut nécessiter une autorisation pour accéder à ChatGPT ou à la recherche Google. Assurez-vous que vos paramètres sont configurés pour une expérience transparente.
  • Lorsque vous utilisez ChatGPT, n'hésitez pas à poser des questions de suivi si la réponse initiale est incomplète ou peu claire.
  • Visual Intelligence ne stocke ni ne partage les images capturées avec Apple.
  • Si vous recevez des informations inexactes, soumettez vos commentaires à Apple, Google ou ChatGPT directement dans l'interface pour aider à former leurs modèles.

L’intelligence visuelle sur la gamme iPhone 16 offre aux utilisateurs un nouveau niveau d’accès aux informations et de flexibilité. Que vous exploriez votre environnement, recherchiez des informations sur des produits ou identifiiez des objets, cet outil ouvre de nouvelles possibilités d'interaction dans le monde réel et d'intelligence numérique en déplacement. En tirant parti de services tels que ChatGPT et Google Search, l’intelligence visuelle d’Apple offre une puissante combinaison de confidentialité, de contrôle et d’informations immédiates, le tout dans la paume de votre main.

Photo de couverture et captures d’écran par Shutterstock