Objekterkennung

Automatische Objekterkennung mit Hilfe der Software OpenCV. Hierzu wurde ein zuvor auf dem COCO-Dataset trainiertes YOLOv3 Modell geladen welches 80 verschiedene Objekte identifizieren kann.

Objekterkennung ist ein Teilgebiet der Bildverarbeitung bzw. des computerbasierten Sehens, bei der man versucht, in Bildern einzelne Objekte zu identifizieren. Ein Bild wird hierbei in Regionen unterteilt, die sinnvolle Einheiten bilden, welche dann weiter auf Merkmale hin untersucht werden, um die Bildregion einer Klasse von Objekten zuordnen zu können. Eine vorläufige Objekterkennung läuft meistens nach diesem Schema ab: Unterteile ein Bild in kleinere Bildausschnitte (Fenster) fester Größe und wende dann einen Klassifizierungsalgorithmus auf dieses Fenster an.[1]

Während es uns Menschen relativ leicht fällt einzelne Objekte, z. B. ein Pudel oder ein Schäferhund, einer abstrakten Kategorie zuzuordnen, in diesem Fall der Kategorie Hund, ist es extrem schwer dies einem Computer beizubringen. Diese Aufgabe wird umso schwieriger, je mehr Klassen von Objekten identifiziert werden sollen. Deswegen wendet man i. d. R. einen spezifischen Algorithmus auf das Bild an, welcher z. B. nur Gesichter erkennen kann.[2]

  1. David A. Forsyth, Jean Ponce: Computer Vision: A Modern Approach. 2. Auflage. Pearson, Boston 2012, ISBN 978-0-13-608592-8.
  2. Richard Szeliski: Computer Vision: Algorithms and Applications, 2nd ed. Abgerufen am 25. September 2022.

From Wikipedia, the free encyclopedia · View on Wikipedia

Developed by razib.in