Direkt zum Inhalt
Videosicherheit 3. November 2021

Einsatz Künstliche Intelligenz in der Videobranche

Edwin Beerentemfel von Axis Communications über Möglichkeiten und Grenzen Künstlicher Intelligenz und deren Einsatz in der Videosicherheitsbranche.

Verkehrsströme auf stark befahrenen Straßen lassen sich mit dem Einsatz Künstlicher Intelligenz beobachten und analysieren. So können beispielsweise fundierte Vorhersagen zum Verkehrsaufkommen getroffen werden.
Verkehrsströme auf stark befahrenen Straßen lassen sich mit dem Einsatz Künstlicher Intelligenz beobachten und analysieren. So können beispielsweise fundierte Vorhersagen zum Verkehrsaufkommen getroffen werden.

Wie wird Künstliche Intelligenz in der Videosicherheitsbranche eingesetzt? Welche Chancen und Herausforderungen ergeben sich daraus? Über diese Fragen sprach PROTECTOR mit Edwin Beerentemfel, Manager Global Partners & End Customers Middle Europe bei Axis Communications.

Künstliche Intelligenz ist bereits seit einiger Zeit eines der großen Trendthemen der Videosicherheitsbranche. Doch was ist damit eigentlich genau gemeint, wie würden Sie diesen Begriff definieren?

Das ist richtig, Künstliche Intelligenz ist eines der großen Themen unserer digitalisierten Welt. Die KI hat ihren Anfang bereits im letzten Jahrhundert. Der Begriff Artificial Intelligence wurde erstmals 1956 im akademischen Kontext verwendet. Heute verstehen wir KI nicht mehr als einzelnen, kleinen Algorithmus, sondern als automatisierten Entscheidungsprozess, der sich bei Bedarf an Situationen anpassen kann. Die KI stützt sich dabei auf Algorithmen, um Daten zu verarbeiten, daraus zu lernen und Vorhersagen zu treffen. Verkehrsströme auf stark befahrenen Straßen können so zum Beispiel beobachtet und analysiert werden und fundierte Vorhersagen zum Verkehrsaufkommen getroffen werden.

Betrachtet man die Berichterstattung, könnte man meinen, die KI durchdringt unser ganzes Leben und ist schon in sämtlichen Anwendungen im Einsatz: Ist dieser Eindruck aus Ihrer Sicht korrekt?

Die KI ist in unserer digitalisierten Welt inzwischen wirklich fast überall angekommen. Wir finden sie in autonomen Fahrzeugen, medizinischen Anwendungen, Suchmaschinen, virtuellen Assistenten und in der Bilderkennung. Es zeichnet sich ab, dass KI-Anwendungsfälle in den kommenden Jahren in vielen Branchen zunehmen werden. Experten gehen davon aus, dass sich Künstliche Intelligenz unter anderem zu einem Schlüsselfaktor bei der Überwachung entwickeln wird. Denn KI-basierte Systeme sind in der Lage, große Datenmengen zu analysieren. Dabei lernt die Anwendung, Menschen und Dinge zu identifizieren oder Mitteilungen über die wahrscheinliche Bewegungsrichtung von Objekten oder Menschen zu versenden. Das ist gerade in der Sicherheitsbranche von großer Relevanz und von der klassischen Bilderkennung, die bereits in den 1980er-Jahren eingeführt wurde, klar zu trennen.

Anzeige

Möglichkeiten und Grenzen Künstliche Intelligenz für die Videosicherheitsbranche

Wie weit ist die KI in der Videosicherheitsbranche? Sind Menschen in der Bewertung von Videomaterial vielleicht sogar schon obsolet geworden?

Momentan lernen die verschiedenen KI-Systeme, auch in der Videosicherheitsbranche, tagtäglich sehr viel. Sie analysieren Pixel für Pixel, verstehen die zugrundeliegenden Konzepte aber nicht. Ein Beispiel: Eine KI-Anwendung kann eine sich in Bewegung befindliche Person zwar erkennen, diese aber im Gegensatz zum Menschen nur schwer in einen Kontext setzen, das heißt es fällt dem System schwer zu beurteilen, warum die Person im Bild gerade rennt – möchte sie den Bus erwischen oder hat sie gerade eine Bank ausgeraubt?

Trotz erheblicher Fortschritte bei der Verwendung von KI in Videosicherheitsanwendungen, kann ein Computer noch nicht im gleichen Umfang Dinge verstehen, wie es ein Mensch tut. Diese fehlende Präzision und Abstraktion ist der Hauptgrund, warum die Systeme meist nur als Unterstützung verwendet und Entscheidungen nicht komplett durch sie getroffen werden. Bei ungünstigen Wetterverhältnissen durch Regen, Nebel oder Dunkelheit oder völlig unbekannten Ereignissen kommt es zu Fehleinschätzungen und -alarmen. Die finale Entscheidung sollte deshalb aktuell noch einem Menschen überlassen werden. Die KI wird lediglich verwendet, um Vorfälle grob einzuordnen. Aus unserer Sicht sind Menschen bei der Bewertung von Videomaterial also weiterhin unbedingt notwendig und keinesfalls obsolet.

Künstliche Intelligenz tut sich noch schwer damit, Ereignisse in einen Kontext zu setzen. Ist die Person zutrittsberechtigt, oder will sie einbrechen?
Künstliche Intelligenz tut sich noch schwer damit, Ereignisse in einen Kontext zu setzen. Ist die Person zutrittsberechtigt, oder will sie einbrechen?

Wie hängen Edge Computing, Deep Learning und Machine Learning mit KI zusammen?

Die drei Konzepte hängen sehr eng mit KI zusammen: Machine Learning (ML) und Deep Learning (DL) sind zwei Teilbereiche der KI. Im ML lernen Systeme selbstständig aus Daten und verbessern sich, ohne dafür programmiert zu sein. Das wird durch die Eingabe von zusammenhängenden Datensätzen möglich. Dadurch „lernt“ das System Strukturen und Muster kennen und kann diese später auf bisher unbekannte Zusammenhänge anwenden. DL wiederum ist ein Teilbereich des ML, das noch größere Datenmengen verwendet, damit sogenannte neuronale Netze aufbaut, und so menschliches Lernverhalten imitiert.

Zum Edge Computing: Fortschrittliche KI-Analysen werden häufig in den Kameras selbst durchgeführt. Die Informationsverarbeitungsleistung sitzt dadurch am Rand des Netzwerks, also „on the edge“, und damit so nah wie möglich an der Bildquelle. So hat die Analyse Zugriff auf das qualitativ hochwertigste Videomaterial. Findet die Analyse nämlich innerhalb eines herkömmlichen Server-Modells statt, wird das Videomaterial oft komprimiert, bevor es übertragen wird. Die Analyse wird dann mit Videomaterial durchgeführt, das nur noch eine reduzierte Qualität aufweist. Die Bereitstellung leistungsstarker Analysen on the edge hat den großen Vorteil, dass nur die relevantesten Informationen über das Netzwerk gesendet werden. Die Belastung von Bandbreite und Speicherplatz wird enorm reduziert und damit auch der Energieverbrauch – was sowohl Kosten als auch Umweltbelastung durch CO2-Emissionen minimiert.

Wo wird die Reise der KI hingehen – und wie schnell werden mögliche anstehende Veränderungen stattfinden?

Die rasche Entwicklung der KI war bisher nicht nur eine Frage der Hard- und Software. Sie profitierte vor allem von einer offenen Gemeinschaft und einer engen Zusammenarbeit zwischen Wissenschaft und Industrie. Open-Source-Werkzeuge und -Datensätze werden zukünftig eine grundlegende KI für jeden zugänglich machen. Mit der weit verbreiteten Verfügbarkeit von Werkzeugen und Hardware wird es im nächsten Jahrzehnt nicht mehr darum gehen, wer die besten KI-Komponenten hat, sondern wer mit ihrer Hilfe die Kundenbedürfnisse am besten versteht und die qualitativ hochwertigsten Datensätze verwendet.

Machine Learning (ML) und Deep Learning (DL) sind zwei Teilbereiche der KI. Im ML lernen Systeme selbstständig aus Daten und verbessern sich, ohne dafür programmiert zu sein. Das System lernt Strukturen und Muster kennen und kann diese später auf bisher unbekannte Zusammenhänge anwenden.
Machine Learning (ML) und Deep Learning (DL) sind zwei Teilbereiche der KI. Im ML lernen Systeme selbstständig aus Daten und verbessern sich, ohne dafür programmiert zu sein. Das System lernt Strukturen und Muster kennen und kann diese später auf bisher unbekannte Zusammenhänge anwenden.

Wo sehen Sie die Hauptvorteile von KI in der Videosicherheitsbranche?

Die Leistungsfähigkeit von Künstlicher Intelligenz ist besonders im Hinblick auf Verbesserungen wie Systemoptimierung, Standortgestaltung, Bildkonfiguration und Gerätemanagement enorm. Aber Deep Learning-Anwendungen und Edge Computing können nicht nur für video- oder bildbasierte Analysen verwendet werden, sondern auch für Audioanalysen. Beispielsweise sind Schüsse oder zerbrechendes Glas mit bildbasierter Analyse schwer zu entdecken. Der Schlüssel zur erfolgreichen Anwendung dieser neuen Techniken ist der Datensatz, mit dem sie arbeiten. Für das korrekte Training und das Testen von ML-Modellen sind Datensätze erforderlich, die groß und reichhaltig genug sind, um die Vielfalt und die Arten von Bildern und Klängen zu beschreiben, die die KI klassifizieren soll.

axis_tour_mitteleuropa_2.jpeg
Axis mit Experience Center auf Tour
Axis Communications ist noch bis November mit dem Axis Experience Center (AEC) auf Tour durch Mitteleuropa zu seinen Partnern und Kunden.

Welche ethischen Probleme und Herausforderungen entstehen durch den Einsatz von KI, und wie lösen Sie diese?

Wie so oft bei automatisierten Vorgängen, hängt auch der Erfolg von KI-Anwendungen von den Rohdaten ab. Sind die Daten schlecht, wird auch die Schlussfolgerung nicht gut sein. Zusätzlich führt alleine die Menge an Daten, die für KI-Anwendungen benötigt wird, unweigerlich zu Herausforderungen in Bezug auf den benötigten Speicher, die Rechenleistung und den Stromverbrauch. DL-Anwendungen benötigen eine sehr hohe Rechenleistung und viel Speicherplatz, entweder in der Cloud oder auf einem Server mit mehreren GPUs. Edge Computing kann zwar an einigen Stellen für Entlastung in diesen Bereichen sorgen, aber die Herausforderungen nicht komplett lösen.

Darüber hinaus gibt es eine grundlegende Herausforderung, die es weiterhin zu lösen gilt: Eine Videosicherheitslösung – mit oder ohne KI – ist eigentlich nie eine Standardlösung, denn jedes Unternehmen und jeder Standort ist einzigartig. Die Systeme müssen sich also an die spezifischen Bedingungen und unterschiedlichen Umgebungen anpassen. Jede KI wird für eine ganz bestimmte Umgebung erstellt und kann nicht einfach auf andere Umgebungen übertragen werden.

Passend zu diesem Artikel