KI und (Offene) Daten

Autoren: Stephan Bernoth, Sven Hense, Christian Horn, Karsten Krumm, Damian Paderta, Felix Schmitt

Das Thema (Offene) Daten hat viele Facetten: Big Data, Urban Data, Open Data, Predictive Analytics. Sie alle stehen beispielhaft für die zahlreichen Möglichkeiten der Datenanalyse und -nutzung – speziell im Kontext des Themas Künstliche Intelligenz (KI). Vor diesem Hintergrund überrascht es also nicht, dass die Professionalisierung des kommunalen Datenmanagements ein zentrales Handlungsfeld in den kommenden Jahren sein wird beziehungsweise sein muss. Dazu gehören unter anderem die Bausteine Data-Warehouse, Data-Governance und Datenkompetenzen. Wichtig ist, dabei nicht nur die Verwaltung selbst in den Blick zu nehmen, sondern das gesamte kommunale Ökosystem. Dazu gehören neben der Kommunalverwaltung insbesondere der Konzern Kommune und der gesamte urbane und ländliche Datenraum mit allen Akteuren der örtlichen und regionalen Gemeinschaft. Dabei steht gerade der “Konzern Kommune” für das veränderte Bild der Kommunen und ihrer Beteiligungen und somit auch für notwendige Betrachtung der ökonomischen Aspekte im Kontext der Datennutzung.

Ein wirklicher Mehrwert durch Daten kann, gerade beim Thema KI, aber nur erzeugt werden können, wenn Kommunen ihre Datenbestände in maschinenlesbaren Formaten sowie IT-Schnittstellen nach innen und außen öffnen und damit in Folge offene Innovationsprozesse im kommunalen Ökosystem ermöglichen. Voraussetzung ist natürlich, dass dies auch gesetzlich möglich ist. Die Datenbestände können dann verwaltungsintern und extern weiter nachgenutzt und intelligent miteinander verknüpft werden. Auch dies geschieht im Idealfall im Sinne einer möglichst gesamtheitlich und gemeinwohlorientiert gedachten urbanen und ländlichen Daten-Plattform, an der sich Akteure aus dem Konzern Kommune, Mobilitätsdienstleister, Wirtschaft und Wissenschaft gemeinsam beteiligen.

Am Hinweis zur Öffnung der Datenbestände ist bereits zu erkennen, dass Open Data ein zentraler Baustein im Sinne eines wirksamen Datenmanagements ist und ein professionelles Datenmanagement die Öffnung von Datenbeständen prozessimmanent forciert und erleichtert. Aus diesem Grund wird das Thema Open Data in diesem Beitrag auch vertieft aufgegriffen.

Nachfrage nach Open Data ist im Wandel

Waren es in den ersten Jahren vor allem die Zivilgesellschaft oder einzelne Berufsgruppen wie (Daten-) Journalist:innen, die nach der Öffnung von Daten der öffentlichen Hand verlangt haben, kommt diese Nachfrage jetzt in immer stärkerem Maße von der Wirtschaft. Sie hat erkannt, dass neben anderen Nutzungsszenarien die Daten der Verwaltung ein zentraler und notwendiger Baustein für die Entwicklung von KI-Anwendungen sind. Vor diesem Hintergrund sind auch die Forderungen der Kommission Wettbewerbsrecht 4.0 der Bundesregierung1 nach einem besseren Zugang zu Daten oder das Positionspapier des Deutschen Digitalverbandes Bitkom [2] zu Open Data zu sehen.

Offenheit schafft Vertrauen

Die Forderung nach offenen Daten hat im Kontext von KI aber noch einen anderen Grund: Offenheit und Transparenz schaffen Vertrauen und Akzeptanz. Gerade im Zuge des zunehmenden Einsatzes von digitalen Technologien und der Automatisierung ist es wichtig zu wissen, wie Maschinen zu Empfehlungen oder gar Entscheidungen kommen: Welche Daten werden dafür herangezogen? Welche Software – welcher Code und welche Algorithmen – sind an den Prozessen beteiligt? Allein die Möglichkeit, diese Kontrolle ausüben zu können, führt oft schon dazu, dass Ängste abgebaut werden und die Systeme eine bessere Legitimation und Vertrauen erhalten. Außerdem stärkt es die Datensouveränität.

“Open” steht daher auch für Demokratie und Transparenz sowie einem diskrimierungsfrei zugänglichen Wissen und einer Teilhabe an Informationen. Neben Open Data ist daher auch Open Source als offene technische Infrastrastrukur in der Diskussion. Denn: Gegenwärtig basieren die meisten KI-zentrierten Innovationen auf einem Geschäftsmodell, bei dem Trainingsdaten als geschütztes geistiges Eigentum betrachtet und KI-Systeme im Allgemeinen als undurchschaubare “Black Boxes” – also ohne Kenntnis ihrer internen Funktionsweise – für Externe nicht nachvollziehbar genutzt werden. Dies ist problematisch, da ein solch ausgerichtetes Geschäftsmodell zu beispielsweise behördlichen Anwendungen im Verkehrs- oder Gesundheitssektor einen abschreckenden Effekt auf die Innovation haben und einen florierenden KI-Sektor zum Stillstand bringen kann.

Das Energieverhältnis von (Offenen) Daten und KI zeigt: Grundsätzlich stehen die Zeichen für mehr Open Data in der Verwaltung gut. Die Themen KI und Open Data beflügeln sich wechselseitig. Im Rahmen der Initiative #KoKI haben die Expert:innen einen intensiven Blick auf den aktuellen Einsatz von KI in unterschiedlichen Lebens-, Arbeits- und Wirtschaftsbereichen geworfen. Das Ergebnis: Maschinenlesbare Daten, wie sie benötigt werden, sind in Ansätzen innerhalb von Verwaltungsorganisationen und außerhalb der Verwaltung im urbanen und ländlichen Raum vorhanden. Hier muss in Zukunft noch technisch und personell weiter investiert werden.

Auf die Datenbasis kommt es an

Solange eine Kommune selbst KI-Anwendungen entwickelt, kann sie auf die Datenbasis insbesondere der Verwaltung zurückgreifen und ihre Systeme trainieren. Vor dem Hintergrund der Komplexität des Themas und fehlender eigener personeller Ressourcen in der IT werden Kommunen und öffentliche Stellen aber oftmals mit externen Partnern zusammen arbeiten müssen. Auch wenn der Wunsch nachvollziehbar ist, dass diese Partner mit fertigen KI-Anwendungen vor der Tür stehen, muss man sich vor Augen führen, dass bereits für die Entwicklung von solchen Anwendungen in der Regel eine große und qualitativ geeignete Datenbasis und administrative Betreuung erforderlich ist. Das System muss damit trainiert werden, bevor es in der Lage ist, selbständig Entscheidungen zu treffen und eigenständig zu lernen.

Das heißt im Umkehrschluss, dass bevor ein Unternehmen überhaupt wirksam mit einer Kommune zusammenarbeiten kann und dann auch den direkten Zugriff auf die relevanten Daten bekommt, es für die Anwendungsentwicklung offene, qualitativ hochwertige Verwaltungsdaten als Grundlage benötigt. Verfügbare und maschinenlesbare Datensätze können den Einstieg in erste kommunale KI-Projekte erheblich vereinfachen. Sie reduzieren die Kosten für Anwendungsentwicklungen und KI-Datenaufbereitung und machen es Verwaltungen einfacher, junge Start-Ups wie auch etablierte KI-Entwickler:innen als Partner:innen zu gewinnen. Doch wo sollen diese Daten herkommen?

Großer Nachholbedarf für Open Data auf kommunaler Ebene

Der Anteil der Kommunen in Deutschland, die ihre Daten als „Open Data“ zur Verfügung stellen, ist nach wie vor sehr gering. Auf Landes- oder Bundesebene sieht die Bereitschaft zur Datenbereitstellung relativ gesehen geringfügig besser aus. Aber gerade in Kommunen besteht noch erheblicher Nachholbedarf. Wie einfach die Datenöffnung ist und welche Daten bereits im kommunalen Bereich zur Verfügung gestellt werden, lässt sich gut am Musterdatenkatalog [3] erkennen.

Doch ist das lange propagierte proaktive “Open by default” auch der richtige Ansatz um eine sowohl quantitativ als auch qualitativ geeignete Datenbasis für KI-Algorithmen zu liefern? Oder wäre nicht gar ein Ansatz zielgerichteter Datenbereitstellung effektiver und ein sinnvolles Etappenziel? Unabhängig davon, welchen Weg Kommunen wählen, wird Open Data die Entwicklung von KI unterstützen.

Sollten noch keine offenen Daten verfügbar sein, kann zum Einstieg eine gezielte Open- by-Demand-Strategie die Hürden senken. Im Mittelpunkt stehen hier die Datenbedarfe zur Lösung bestehender Probleme durch KI-Systeme, deren notwendige Datengrundlage ganz gezielt erarbeitet und bereitgestellt wird. Neben der Verfügbarkeit umfangreicher und qualitativ hochwertiger Open Data-Bestände ist die Qualitiät der KI-Algorithmen gleichermaßen der Schlüssel für eine erfolgreiche Anwendung. Fragen nach dem Ursprung der Daten, der Datenverantwortlichkeit, den Anforderungen und der Eignung von Open Data sind dabei immanent zu betrachten und zu beantworten. Dabei gilt es auch ein Augenmerk auf die Sicherung der Datenrechte bei Vertragsverhandlungen und Beschaffungen durch Kommunen zu richten. Kommunale Daten müssen als ein strategisches Thema begriffen werden, denn die Unabhängkeit (Datensouveränität) von einschränkenden Datenrechten Dritter kann erst eine KI-Nachnutzung ermöglichen. Vor einer Entscheidung zu einer KI-Anwendung muss eine Entscheidung für die Professionalisierung des kommunalen Datenmanagements und damit auch für Open Data als Bestandteil erfolgen.

Gute Beispiele gibt es schon

KI-Anwendungen bringen bereits heute viele Vorteile: Die Optimierung von Prozessabläufen, Mustererkennung, Vorhersagen und Hypothesentests, natürliche Sprachverarbeitung und maschinelle Übersetzungen sind an dieser Stelle nur beispielhaft genannt. Die KI-Modelle, die diese Aufgaben ausführen, benötigen oft große Datenmengen und erzeugen diese gleichzeitig auch selbst. In manchen Fällen bilden offene Datensätze (Open Data) die Basis für die Entwicklung von KI-Systemen.

Gute Beispiele, was mit offenen Daten erreicht werden kann, gibt es durchaus – auch wenn es hier gerade im kommunalen Kontext noch Entwicklungspotenzial gibt. Ein Grund dafür ist sicherlich, dass sich insgesamt noch zu wenig Kommunen mit dem Thema Open Data beschäftigen und die Eröffnung ihrer Datenbestände zu wenig forcieren. Zwei Beispiele werden nachfolgend vorgestellt:

Die Städte Wien [4] und Linz bieten mit dem „Corona-Bot“ aktuelle und verifizierte Informationen von den Websites der Österreichischen Bundesministrien und anderen öffentlichen Quellen. Der Chatbot generiert Antworten in Echtzeit und umfasst aktuell 170 verschiedene Antworten zu Fragen rund um das Virus.

Die “Amsterdam-City-Card” erfasst mittels RFID- Chip Ort und Uhrzeit, sobald ein Nutzer mit der Karte ein Museum betritt. Die Kommune leitet aus den so erhaltenen Bewegungsdaten Muster ab, aufgrund derer die zugehörige Internetplattform der Amsterdam-Card in Abhängigkeit der erhaltenen Daten unterschiedliche Routen durch die Stadt vorschlägt und so Touristenströme leitet.

Im bereits erwähnten Musterdatenkatalog erfolgt eine Einordnung der Daten zu einzelnen Themenbereichen und Kategorien mittels eines KI-Algorithmus. So kann die anfänglich manuelle Zuordnung nach und nach der Maschine überlassen werden.

Ein guter Zeitpunkt, um in Open Data zu investieren

Die Öffnung ihrer Daten haben viele Kommunen bisher oftmals aus wirtschaftlichen Gründen und damit verbundenen mangelnden IT- Ressourcen vernachlässigt. Wie insbesondere die letzten Abschnitte gezeigt haben, ist jetzt ein guter Zeitpunkt in Daten und speziell in ein kommunales Datenmanagement und Open Data zu investieren. Denn die Investition bringt mittel- bis langfristig auch für die eigene Verwaltung erhebliche Vorteile – insbesondere dann, wenn dieser Aspekt über eine ohnehin notwendige Professionalisierung des Datenmanagements erfolgt. Darüber hinaus trägt die Kommune, neben dem wirtschaftlichen Aspekt, auch zu einer positiven volkswirtschaftlichen Entwicklung bei und sorgt für eine größere Transparenz und Zukunftsfähigkeit des eigenen Handelns.