adesso Blog

Die Objekterkennung ist weit verbreitet und wird in verschiedenen Anwendungen wie der Erkennung von Personen, Autos usw. eingesetzt. Es fehlt jedoch die Intelligenz, um festzustellen, ob es sich bei verschiedenen Bildern in Videosequenzen um dasselbe erkannte Objekt handelt. Daher ist die Objektverfolgung für viele Anwendungen des maschinellen Sehens von entscheidender Bedeutung. Von der Analyse von Personen- und Verkehrsströmen bis hin zur Analyse von Bewegungsmustern bei sportlichen Aktivitäten spielt die Objektverfolgung eine unverzichtbare Rolle bei der Gewinnung wertvoller Erkenntnisse.

Mit den Fortschritten im Bereich der Künstlichen Intelligenz und des maschinellen Lernens werden Objektverfolgungsalgorithmen wie Multiple Object Tracking (MOT) und Single Object Tracking (SOT) immer intelligenter und ermöglichen eine genauere und schnellere Objektverfolgung. Während MOT mehrere Objekte gleichzeitig verfolgt und daher in belebten Szenarien wie Verkehr oder Mannschaftssport unverzichtbar ist, konzentriert sich SOT auf ein einzelnes Objekt. Angesichts dieser Vielfalt an Anwendungsfällen stellt sich die Frage, welcher Objektverfolgungsalgorithmus für einen bestimmten Anwendungsfall am besten geeignet ist. Um diese Frage zu beantworten, haben wir ein Experiment durchgeführt, dessen Ergebnisse ich in diesem Blog-Beitrag vorstellen möchte.

Das Experiment

In diesem Experiment wurden verschiedene Methoden zur Verfolgung mehrerer Objekte anhand verschiedener Metriken bewertet, wobei der MOT17-Wettbewerb als Benchmark diente.


Metriken im Überblick

Erkenntnisse

Das Experiment zeigte, dass die Algorithmen in verschiedenen Anwendungsfällen unterschiedliche Ergebnisse lieferten, was deutlich macht, dass es keine "one size fits all"-Lösung gibt. Einige Tracker wie SORT zeigten eine bemerkenswerte Geschwindigkeit, während ihre Genauigkeit in Szenarien mit häufigen Verdeckungen und schnellen Objektbewegungen erheblich beeinträchtigt wurde. Andere Methoden, bei denen ein Deep-Learning-Modell in den Tracker integriert ist, wie zum Beispiel DeepSORT, können sehr gut mit Verdeckungen umgehen, haben aber Probleme mit schnellen Objektbewegungen. Andere Methoden wie ByteTrack sind vielversprechend im Umgang mit überlappenden Trajektorien, zeigen aber Einschränkungen bei der Aufrechterhaltung konsistenter Trackidentitäten über längere Zeiträume.


Ergebnis der verschiedenen Tracker-Algorithmen


MOT17 raw (Quelle: https://motchallenge.net/vis/MOT17-11-SDP)


ByteTrack Output

Fazit

Object Tracking in Videos ist ein wichtiges Gebiet mit vielen Anwendungsmöglichkeiten. Die Ergebnisse dieses Experiments geben einen wertvollen Einblick in die Leistungsfähigkeit verschiedener Objektverfolgungsmethoden und legen nahe, dass die Wahl der richtigen Methode stark von den spezifischen Anforderungen des Anwendungsfalles abhängt.

Bild Aynur Amirfallah

Autor Aynur Amirfallah

Aynur Amirfallah ist seit mehreren Jahren bei adesso als Data Scientist mit den Schwerpunkten Deep Learning und Computer Vision tätig. In ihrer aktuellen Rolle im Competence Center Data Science ist sie für die Beratung von Kunden zu KI-Lösungen und deren Umsetzung verantwortlich.

Kategorie:

KI

Schlagwörter:

Künstliche Intelligenz

Diese Seite speichern. Diese Seite entfernen.