Daten sind der Rohstoff für Forschung, Innovation und Wirtschaft im 21. Jahrhundert. Ein offener, unbeeinflusster und nachvollziehbarer Zugang zu Information ist daher eine Grundvoraussetzung für die freie Entfaltung der digitalen Gesellschaft. Derzeit ist aber insbesondere die Internetsuche hochgradig monopolisiert. Dies beeinflusst den Zugang zu Information und Wissen, behindert Wissenschaft und Wirtschaft und beeinträchtigt Europas digitale Souveränität. Substanzielle und effektive Werkzeuge sowie Infrastrukturen zur unabhängigen Navigation und Nutzung der Digitalsphäre sind daher für die Forschung sowie für Europas Souveränität besonders wichtig.
Das Projekt OpenSearch@DLR greift dieses, für das DLR und die Wissenschaft an sich, strategisch wichtige Digitalthema auf und entwickelt Konzepte für eine verteilte und offene Infrastruktur für die Internetsuche der nächsten Generation. Das Ziel: Die bessere Erschließung des Datenschatzes im Internet durch unbeeinflusstes Suchen und Finden wissenschaftlicher Daten und Information, als Grundlage für freie Forschung und Innovation.
Nächste Projektphase gestartet
Das Projekt OpenSearch@DLR 2.0 ist als Nachfolger des Projekts OpenSearch@DLR Anfang 2023 gestartet. Es soll den Aufbau einer DLR-Suchinfrastruktur aus modularen Komponenten zur Akquisition, Aufbereitung und Anreicherung von Web- und Forschungsmetadaten voranbringen. Gleichzeitig soll es neue Technologien und Innovationen im Bereich der Internetsuche und des Informationsmanagements integrieren. Dies umfasst internes wie externes verteiltes Webcrawling, Anschluss an Spezialdatenbanken, zum Beispiel in der Erdbeobachtung oder im Forschung-Datenmanagement, sowie neue Methoden zur automatischen Informationserschließung in sehr großen Datenbeständen durch den Einsatz von Methoden der künstlichen Intelligenz (KI).
Innerhalb von vier Jahren werden Mitarbeiterinnen und Mitarbeiter des Deutschen Fernerkundungsdatenzentrums, des Instituts für Softwaretechnologie und des Instituts für Datenwissenschaften im Projekt OpenSearch@DLR in den Arbeitsbereichen Crawling, Webdatenanalyse, Anwendungsentwicklung und -integration sowie Netzwerk/Community-Building an der DLR-Websuche und Webdatenanalyse der nächsten Generation arbeiten.
Neben technischen Entwicklungen soll die Kooperation mit dem Netzwerk OpenWebSearch.eu ausgebaut werden. Zusätzlich zu den technischen Arbeiten sind interne und externe Community Veranstaltungen wie Kolloquien und Wissensaustausch-Workshops sowie öffentlichkeitswirksame Aktivitäten vorgesehen.