Live Object and Keypoint Detection

Institute for Machine Learning, JKU Linz (AT)

Um die Standorte und die Arten von Objekten in einem Bild zu identifizieren, können Deep Learning-Modelle verwendet werden, die auf Computer Vision basieren. Gezeigt werden zwei Beispiele:

  1. Objekterkennung: Ein künstliches neuronales Netzwerk wurde mit 80.000 Bildern trainiert. Es kann 80 verschiedene Objektklassen wie Personen, Telefone und Bananen in Echtzeit erkennen.
  2. Erkennung von Schlüsselpunkten (Keypoint Detection): Es handelt sich um ein Echtzeit-Mehrpersonen-System, das in der Lage ist, Schlüsselpunkte des Menschen wie Hände, Gesicht und Füße gemeinsam zu erkennen. Dieses Modell wurde auf 250.000 annotierten Instanzen trainiert.

Mit einer Webcam, die an einen leistungsstarken Computer angeschlossen ist, kann hier die Leistung dieser Deep Learning-Algorithmen in einer Live-Umgebung erlebt werden.

Institute for Machine Learning, Johannes Kepler University, AUT (https://www.jku.at/iml)
Facebook AI Research, USA (https://github.com/facebookresearch/Detectron)
Carnegie Mellon University, USA (https://github.com/CMU-Perceptual-Computing-Lab/openpose)