Suite à une conversation sur le sujet avec chatgpt :
Markus : Tu sais, j'ai vu une vidéo intéressante qui parlait de l'importance de la reconnaissance visuelle tant pour les humains que pour les ordinateurs.
ChatGPT : Vraiment ? Qu'est-ce que disait la vidéo ?
Markus : Au début, il y avait une petite fille de 3 ans qui décrivait des photos, et malgré sa description simple, elle arrivait tout de même à comprendre ce qui se trouvait sur la photo.
ChatGPT : C'est incroyable de voir comment les enfants arrivent à apprendre si vite à reconnaître les choses qu'ils voient. Mais pourquoi est-ce important aussi pour les ordinateurs ?
Markus : Exactement, c'est justement le point. Si l'on pense aux machines qui conduisent seules, par exemple, si elles ne sont pas capables de distinguer un morceau de papier sur la route d'une pierre, cela pourrait poser problème.
ChatGPT : Tu as raison, des situations similaires se retrouvent également dans d'autres technologies. Cela signifie que notre capacité à reconnaître ce que nous voyons est limitée à ce que nos yeux peuvent faire.
Markus : Exact, c'est justement pour cela que Fei Fei Li, un expert en vision artificielle, a travaillé pour enseigner aux ordinateurs à « voir ». Elle a fondé une base de données appelée ImageNet, qui contient plus d'un milliard d'images divisées en différentes catégories.
ChatGPT : Wow, un milliard d'images, c'est vraiment impressionnant. Mais comment cette base de données a-t-elle été utilisée ?
Markus : Les images ont été utilisées comme entrée dans un modèle d'intelligence artificielle appelé réseau de neurones. Ce modèle a été capable de reconnaître des objets même dans des environnements complexes et de fournir des descriptions spécifiques.
ChatGPT : Donc, grâce à ImageNet, l'IA a été capable de voir et de comprendre ce qui se trouvait sur les photos ?
Markus : Exactement ! Mais pas seulement. Par la suite, un modèle a été développé qui intègre également le langage et la vision. En pratique, l'IA a été capable de reconnaître ce que montrait la photo et de le décrire avec une phrase.
ChatGPT : Donc l'IA a été capable de comprendre, par exemple, qu'il y avait un chat assis sur un lit avec un ordinateur sur une photo ?
Markus : Exactement ! Même si parfois elle pouvait commettre des erreurs ou ne pas arriver à saisir complètement l'émotion ou les détails, cela a tout de même été un pas en avant incroyable qui a ouvert de nombreuses possibilités dans différents domaines, comme celui de la santé ou de la route.
ChatGPT : Il semble que l'IA fasse des progrès rapides. Qu'est-ce que tu penses que l'avenir réserve ?
Markus : La vidéo a été tournée en 2015, donc je suppose que depuis, l'IA a fait des progrès géants. Aujourd'hui, il y a déjà des machines capables de générer des images de haute qualité et des assistants virtuels comme toi, ChatGPT, qui répondent à une large gamme de questions. Qui sait quelles autres surprises l'avenir nous réserve !
ChatGPT : C'est vraiment excitant de penser à toutes les possibilités que l'IA pourrait offrir. Je suis impatient de découvrir ce qui nous attend !