Eine evidenzbasierte STI-Politik (Wissenschaft, Technologie und Innovation) erfordert genaue Indikatoren für Innovationen, um das Wirtschaftswachstum zu fördern. Traditionellen Indikatoren aus Patenten und fragebogenbasierten Erhebungen mangelt es jedoch oft an Abdeckung, Granularität sowie Aktualität und sie sind mit hohen Kosten für die Datenerhebung verbunden, insbesondere wenn sie in großem Maßstab durchgeführt werden. Folglich haben sie Schwierigkeiten, politischen Entscheidungsträgern und Wissenschaftlern ein vollständiges Bild des aktuellen Zustands des Innovationssystems zu vermitteln. In diesem Beitrag schlagen wir einen ersten Ansatz zur Generierung webbasierter Innovationsindikatoren vor, der das Potenzial hat, einige der Unzulänglichkeiten traditioneller Indikatoren zu überwinden. Konkret entwickeln wir eine Methode zur Identifizierung von Produktinnovatoren in großem Maßstab und zu sehr geringen Kosten. Wir verwenden traditionelle Indikatoren auf Firmenebene aus einer fragebogenbasierten Innovationserhebung (German Community Innovation Survey), um ein künstliches neuronales Netzwerk-Klassifikationsmodell auf gelabelten (Produktinnovator/kein Produktinnovator) Webtexten der befragten Firmen zu trainieren. Anschließend wenden wir dieses Klassifikationsmodell auf die Webtexte von hunderttausenden von Firmen in Deutschland an, um vorherzusagen, ob sie Produktinnovatoren sind oder nicht. Anschließend vergleichen wir diese Vorhersagen mit Patentstatistiken auf Unternehmensebene, Benchmark-Daten der Umfrage-Extrapolation und regionalen Innovationsindikatoren. Die Ergebnisse zeigen, dass unser Ansatz zuverlässige Vorhersagen liefert und das Potenzial hat, eine wertvolle und sehr kosteneffiziente Ergänzung zu den bestehenden Innovationsindikatoren zu sein, insbesondere aufgrund seiner Abdeckung und regionalen Granularität.

Autoren

Kinne, Jan
Lenz, David

Schlagworte

innovation, web mining, nlp, text mining, indicators