Das Projekt hat sich zum Ziel gesetzt, die Forschungsdateninfrastruktur in Deutschland nachhaltig zu verbessern, in dem zum einen aus bestehenden Datenbeständen - das sind beispielsweise Firmendaten der amtlichen Statistik und aus anderen Quellen und/oder Befragungsdaten, die im Rahmen von öffentlich finanzierten Forschungsprojekten generiert wurden - durch Verknüpfung neue Scientific-Use-Files generiert werden.
Zum anderen sollen neue Datenquellen aus dem WorldWideWeb erschlossen werden. Die Digitalisierung hat in den meisten Lebens- und Unternehmensbereichen Einzug gehalten. Kommunikation und Datenaustausch finden vermehrt auf digitalem Wege statt. Hierbei entstehen massenhaft Daten in verschiedenen Automatisierungs- und Strukturierungsgraden sowie heterogenen Formaten, die auch für die Forschung interessant sind.
Übergreifendes Ziel im Rahmen der „Science Data Centers“, eines vom Land Baden-Württemberg geförderten Projektes, ist der Aufbau eines Kompetenzzentrums für die Datenverfügbarkeit und -analyse in den Wirtschaftswissenschaften (Business and Economic Research Data Center, BERD-Center). Ein Fokus von BERD liegt auf unstrukturierten, meist großen Datenmengen („Big Data“), die über Web-Scraping-Verfahren aus dem WorldWideWeb gewonnen werden und für die Datenanalyse aufbereitet werden sollen. Ein weiterer Schwerpunkt befasst sich mit der Verknüpfung von Firmendatenbeständen - sowohl strukturierter (z.B. Firmenmikrodaten der amtlichen Statistik) als auch unstrukturierter (web-basierter) Daten - und der Generierung eines gemeinsamen Unternehmens-Identifiers.
Für diesen Zweck hat sich ein Projektkonsortium aus dem Mannheim Center for Data Science (MCDS) der Universität Mannheim und dem Zentrum für Europäische Wirtschaftsforschung (ZEW) und den Infrastruktureinrichtungen Universitätsbibliothek Mannheim (UBM) sowie Rechenzentrum der Universität Mannheim (RUM) gebildet.
Das BERD-Center übernimmt ferner folgende Aufgaben:

  1. Bereitstellung der im Projekt generierten Forschungsdaten für andere Forschende - soweit keine rechtlichen Einwände bestehen,
  2. Klärung von datenschutz- und urheberrechtlichen Fragen bei der Weitergabe von web-basierten Daten,
  3. Katalogisierung, Dokumentation und Bereitstellung von Meta-Daten der im Projekt generierten Daten,
  4. Beratungs- und Informationsangebote zu Methoden der Datenerfassung aus dem Internet und die Auswertung von großen Datenmengen,
  5. Konzept und Maßnahmen für die Aus- und Weiterbildung im Bereich „Data Science“ für Forschende aus den Wirtschaftswissenschaften.

Bei allen Diensten wird ein besonderes Augenmerk auf die nachhaltige Verfügbarkeit gelegt. Das Kompetenzzentrum soll auch über die Förderphase hinaus etabliert werden.