Vision par ordinateur

La vision par ordinateur est un domaine scientifique et une branche de l’intelligence artificielle qui traite de la façon dont les ordinateurs peuvent acquérir une compréhension de haut niveau à partir d'images ou de vidéos numériques. Du point de vue de l'ingénierie, il cherche à comprendre et à automatiser les tâches que le système visuel humain peut effectuer[1],[2],[3].

Vue d'artiste d'un Rover automatique explorant la surface de Mars. Il est équipé sur son sommet de deux caméras vidéo lui conférant une vision stéréoscopique.

Les tâches de vision par ordinateur comprennent des procédés pour acquérir, traiter, analyser et « comprendre » des images numériques, et extraire des données afin de produire des informations numériques ou symboliques, par ex. sous forme de décisions[4],[5],[6],[7].

Dans ce contexte, la compréhension signifie la transformation d'images visuelles (l'entrée de la rétine) en descriptions du monde qui ont un sens pour les processus de pensée et peuvent susciter une action appropriée. Cette compréhension de l'image peut être vue comme l’acquisition d'informations symboliques à partir de données d'image, par l'emploi de modèles s’appuyant sur la géométrie, la physique, les statistiques et la théorie de l'apprentissage[8].

La discipline scientifique de la vision par ordinateur s'intéresse à la théorie des systèmes artificiels qui extraient des informations à partir d'images. Les données d'image peuvent prendre de nombreuses formes, telles que des séquences vidéo, des vues de plusieurs caméras, des données multidimensionnelles à partir d'un scanner 3D ou d'un appareil de numérisation médical. La discipline technologique de la vision par ordinateur cherche à appliquer les modèles théoriques développés à la construction de systèmes de vision par ordinateur.

Les sous-domaines de la vision par ordinateur comprennent la détection d'événements, le suivi vidéo, la reconnaissance d'objets, l'apprentissage, l'indexation, l'estimation de mouvement, la modélisation de scènes 3D et la restauration d'image

  1. Dana H. Ballard, Computer vision, Prentice-Hall, (ISBN 0-13-165316-4 et 978-0-13-165316-0, OCLC 7978044, lire en ligne)
  2. C. E. Vandoni, Proceedings : 1996 CERN School of Computing : Egmond aan Zee, the Netherlands, 8 September-21 September 1996, CERN, (ISBN 9789290830955, OCLC 988737270, lire en ligne)
  3. Milan Sonka et Roger Boyle, Image processing, analysis, and machine vision, Thompson Learning, (ISBN 0-495-08252-X, 978-0-495-08252-1 et 978-0-495-24438-7, OCLC 123776599, lire en ligne)
  4. Reinhard Klette, Concise computer vision : an introduction into theory and algorithms, (ISBN 978-1-4471-6320-6, 1-4471-6320-6 et 1-4471-6319-2, OCLC 869222487, lire en ligne)
  5. Shapiro, Linda G., Computer vision, Prentice Hall, (ISBN 0-13-030796-3 et 978-0-13-030796-5, OCLC 247860912, lire en ligne)
  6. Morris, Tim, 1960-, Computer vision and image processing, Palgrave Macmillan, (ISBN 0-333-99451-5 et 978-0-333-99451-1, OCLC 52486158, lire en ligne)
  7. Jähne, Bernd, 1953- Haussecker, Horst., Computer vision and applications : a guide for students and practitioners, Academic Press, (ISBN 978-0-12-379777-3 et 0-12-379777-2, OCLC 162574303, lire en ligne)
  8. Forsyth, David A., Auteur., Computer vision : a modern approach (ISBN 978-1-292-01408-1 et 1-292-01408-3, OCLC 1156470337, lire en ligne)

From Wikipedia, the free encyclopedia · View on Wikipedia

Developed by razib.in