Tobias Blum

Konsolidierte Suche im Enterprise 2.0 Umfeld

Tobias Blum am 09. Februar 2011   Jetzt kommentieren




Die Nadel in vielen Heuhaufen suchen – und finden
Damals im Web 1.0, als Enterprise-Content-Management (ECM) noch in den Kinderschuhen steckte und die Inhalte noch von einigen wenigen Schlüsselpersonen, den „Webmastern“, erfasst und sorgsam hinter Firewalls und in Unternehmensdatenbanken verborgen wurden, war die Suche nach Informationen noch kein Thema für alle Mitarbeiter im Unternehmen. Die Suche fand zumeist hinter den kleinen Textfeldern der Datenbanken statt, die ihre Schätze nur denen preisgaben, die die richtigen Schlüsselwörter und hinterlegten Schlagwörter kannten oder durch Zufall getroffen hatten. Mitunter gerät der eine oder andere Zeitzeuge noch ins Schwärmen, wenn er über diese “Goldgräberzeiten der IT” berichtet; dennoch möchte heute niemand mehr so arbeiten.

Auf dem Weg zum Social Workplace
Seitdem hat sich einiges getan: Mit der Zeit entwickelten sich viele neue Techniken, Webdienste und das Web 2.0. Dank Google ist die Suche nach Informationen im Web ein selbstverständlicher Teil der Internetnutzung und wird in Sekundenbruchteilen abgewickelt. Nutzer können auf einfachem Weg Informationen in einer Vielzahl von Diensten in Blogs, Wikis und sozialen Netzen erfassen. Diese Informationen scheinen sich von selbst an alle gewünschten und auch unerwünschten Orte zu verteilen, sie transformieren und aggregieren sich zu neuen Inhaltstypen. Auf diese Weise entstehen dauerhaft neue Informationen der unterschiedlichsten Art und Qualität.

Auch im Unternehmenskontext hat Enterprise 2.0, die Nutzung von Web-2.0-Technologien im Unternehmen, einiges ins Rollen gebracht. Auf unserem Weg zum Social Workplace entstehen viele neue, sehr unterschiedliche “Informationstöpfe”. Eine Folge davon ist, dass auch die Anzahl der relevanten Datenquellen steigt, die ein Mitarbeiter betrachten muss, wenn er auf der Suche nach Wissen im Unternehmen ist. Jede Lösung mag für sich gesehen mehr oder weniger gute Recherchemöglichkeiten bieten. Allerdings wird mit steigender Zahl der Suchmaschinen im Unternehmen die Frage, wo die benötigte Information gesucht werden muss, zur zentralen Herausforderung und damit auch zum Zeitfresser. An dieser Stelle weicht die Unternehmensrealität oft stark von dem ab, was der Nutzer im Internet gewohnt ist. Wenn solche Themen in Unternehmen wahrgenommen werden, bin ich als Entwickler bei der Konzeption von Intranetprojekten häufig auch beratend tätig. Schnell fällt an dieser Stelle in Workshops das Schlagwort “konsolidierte Suche” oder “federated search”, also die simultane Suche in unterschiedlichsten Datenquellen mit einheitlicher Trefferliste. Einige Hersteller von Suchtechnologien haben zwischenzeitlich ihre Produkte um Möglichkeiten zur konsolidierten Suche ergänzt. Da die technischen Herausforderungen aber groß sind, lohnt sich ein genauerer Blick auf die Software. Die nächsten Absätze sollen einen Einblick in das Thema geben. Letztlich entscheiden ‒ neben der Technik ‒ aus unserer Erfahrung oftmals konzeptionelle Fragen über den Erfolg oder Misserfolg einer Suchlösung im Unternehmen.

Die Herausforderung: Schnell und zentral relevante Ergebnisse finden
Doch was bereitet eigentlich die Probleme im Unternehmensumfeld? Eine zentrale Schwierigkeit ergibt sich aus der Heterogenität der Datenquellen. Neben dem Intranet ist ein Großteil der Inhalte in Form von Dokumenten in den unterschiedlichsten Dateiformaten erfasst und auf Fileservern oder in Dokumentenmanagementsystemen abgelegt; Produktinformationen finden sich in spezialisierten Datenbanken. Mit der wachsenden Bedeutung von sozialen Anwendungen werden eine Reihe weiterer Quellen, wie interne Wikis, Foren oder Kollaborationsplattformen relevant. Die Integration all dieser Systeme mit ihren technischen Eigenheiten und ihrer Vielzahl von Schnittstellen machen die Anbindung an eine gemeinsame Suchmaschine zu einer komplexen Aufgabe.

Die größte Herausforderung in diesem Zusammenhang bleibt aber die Frage, wie aus der enormen Menge an möglichen Treffern wirklich die für den Nutzer relevanten Ergebnisse ermittelt werden können. Untersuchungen und auch die eigene Erfahrung zeigen, dass Nutzer im Vertrauen auf die Qualität der Suchmaschine überwiegend Treffer der ersten Ergebnisseite wählen. Darunter werden wiederum diejenigen, die ohne Scrollen erreichbar sind, bevorzugt. Dies zeigt deutlich, welche zentrale Rolle für den Erfolg einer Suchmaschine ein gutes Ranking der Suchergebnisse einnimmt. Suchmaschinen, denen es nicht gelingt, die besten Treffer im vorderen Teil der Trefferliste zu positionieren, führen schnell zur Frustration der Nutzer und zur Ablehnung des Produkts. Darüber hinaus ist zu bedenken, dass ein Ranking der Suchergebnisse nicht für jeden Nutzer gleichermaßen passt. Abhängig von Arbeitsbereich und thematischem Hintergrund der Suchanfrage sind jeweils andere Ergebnisse von Interesse.


Quelle: http://www.ideaeng.com/tabId/98/itemId/145/Whats-in-a-name-Federated-Search.aspx

Bei Suchmaschinen, die auf verschiedene Quellen zugreifen, zeigt sich eine besondere Herausforderung bei der Ermittlung der Relevanz von Suchtreffern. Die Heterogenität der Quellen sowie der zu durchsuchenden Inhalte macht eine Ermittlung des Rankings besonders schwer. Klassische Verfahren zur Relevanzermittlung scheitern häufig an der unterschiedlichen Struktur, dem variablen Umfang und der ungleichen Qualität der Inhalte. So müssen hier buchstäblich Äpfel mit Birnen verglichen und in eine für den Nutzer sinnvolle Reihenfolge gebracht werden.

Die Stärke einer Suchlösung wird fälschlicherweise mit den Möglichkeiten gleichgesetzt, die das Produkt bietet. Komplexe Suchmasken eröffnen unzählige Varianten bei der Selektion der Ergebnisse, die aber nur von einem kleinen Kreis technisch versierter Anwender genutzt werden (können). Der Großteil der Nutzer ist von umfangreichen Suchmasken schlicht überfordert. Zudem zeigen Untersuchungen, dass die meisten Anfragen aus einem oder nur wenigen Suchwörtern bestehen. Daher empfehlen wir häufig unseren Kunden, auf eine einfache, prominente Suchmaske zu setzen und erfahrenen Nutzern eine erweiterte Suchmaske alternativ zur Verfügung zu stellen. Es hat sich als gut erwiesen, die Sucheingaben der Anwender noch einmal zu prozessieren und automatisch zu optimieren, denn der Nutzer kann durch das System in einem begrenzten Rahmen bei der Suche unterstützt werden. So sehen wir oft vor, dass automatisch nach Varianten eines Wortes gesucht wird. In einigen Fällen sind redaktionell gepflegte Synonymlisten sinnvoll, die Suchwörter automatisch um ihre Synonyme ergänzen. Diese Funktion hat sich besonders bei Produktbezeichnungen und Abkürzungen bewährt. Solche Synonymlisten lassen sich nicht automatisch erzeugen und sind daher meist Ergebnis einer redaktionellen Pflege von Fachredakteuren und müssen regelmäßig erweitert werden.

Während komplexe Suchmasken von einem Großteil der Nutzer nur schlecht angenommen werden, haben sich Möglichkeiten zur Reduzierung der Treffermenge in der Ergebnisdarstellung hingegen bewährt. So werden beispielsweise bei der Facettierung in der Trefferliste Optionen angeboten, sie auf bestimmte Datenquellen, Formate, Teilbereiche oder Sprachen einzuschränken. Diese Möglichkeiten sind vielen Nutzern bereits von großen Websites wie eBay oder Amazon bekannt.

beispiel_ebay.png

Facettensuche auf ebay.de

Technische Herausforderungen
Bei der Aufbereitung der Suchergebnisse sind viele anspruchsvolle Aufgaben zu lösen. Je mehr unterschiedliche Quellen angefragt werden, desto größer wird auch die Wahrscheinlichkeit, dass der gleiche Inhalt in mehreren Quellen in nur leicht veränderter Form vorgehalten wird. Dadurch, dass die gleichen Rankingregeln auf alle Inhalte wirken, werden sich in der Trefferliste Blöcke gleicher Inhalte bilden ‒ in vielen Fällen auch gerade auf der wichtigen ersten Seite der Suchergebnisse. Um diesem Effekt entgegenzuwirken werden Techniken benötigt, die Duplikate zuverlässig erkennen können, auch wenn der Inhalt nicht zu 100 % identisch ist oder in unterschiedlichen Dateiformaten vorliegt. Je zuverlässiger die Deduplizierung arbeitet, desto besser ist die Qualität der Trefferliste für den Nutzer. Technisch ist dieser Prozess anspruchsvoll, da für eine zuverlässige Bereinigung die gesamte Trefferliste betrachtet werden muss und nicht nur der aktuell dargestellte Teil.

Gerade im Intranetumfeld spielen Berechtigungen im Bereich der Suche eine große Rolle. Abhängig vom Nutzer, der die Suche durchführt, dürfen nur bestimmte Quellen angefragt oder nur auf einen Teil der Quelleninhalte zugegriffen werden. Selbst wenn der Zugriff auf den eigentlichen Inhalt dem Anwender durch andere Mechanismen verwehrt würde, so könnte schon der Eintrag in der Trefferliste unberechtigte oder irrelevante Informationen preisgeben. Aus diesem Grund muss die Berechtigungsinformation schon während der Suche ausgewertet und an die verschiedenen Datenquellen korrekt weitergereicht werden. Außerdem: Eine konsolidierte Suche kann immer nur so schnell sein wie die langsamste angeschlossene Quelle. Die Ergebnisse aller angeschlossenen Quellen müssen vorliegen, damit die Trefferliste aufbereitet werden kann.

Auch wenn auf dem Markt einige Suchmaschinen existieren, die vorgeben, ein Komplettpaket für fast jede Herausforderung der konsolidierten Suche zu bieten, wird kein Produkt alle Anforderungen perfekt als Out-Of-The-Box-Lösung abdecken können. Ein Problem sind die Konnektoren der Suchmaschine zu den verschiedenen Datenquellen. Obwohl es durchaus Standards gibt, die den Zugriff einer Suchmaschine auf andere Datenquellen beschreiben, gibt es nur wenige Produktkombinationen, die perfekt miteinander zusammenarbeiten. Für einige Produkte gibt es noch keine Schnittstellen; passende Konnektoren müssen daher erst entwickelt werden. Dazu kommt, dass nicht jeder Hersteller Interesse daran hat, offene Schnittstellen zu seinen Produkten anzubieten, schließlich würde das ja bedeuten, dass das eigene Produkt hinter Konkurrenzprodukten verborgen wird und so im Unternehmen an Relevanz verliert.

Wie Social Media eine Suchlösung bereichern kann
Mit der steigenden Verbreitung von Web-2.0-Technologien in Intranets erschließt sich eine weitere Möglichkeit, Suchergebnisse zu verbessern und für den Nutzer passender bereitzustellen.
Eine Technik, die sich hier besonders anbietet, ist das Tagging, also die freitextliche Verschlagwortung von Inhalten, wie dies von YouTube oder Flickr vielen Nutzern bekannt ist. Damit von den Mitarbeitern die Möglichkeit Tags zu vergeben auch genutzt wird, sollte die Funktion so einfach wie möglich umgesetzt werden und keine explizite Nutzeranmeldung oder besondere technische Kenntnisse voraussetzen.

Textliche Inhalte können so kollaborativ um zugehörige Schlagworte ergänzt werden, die nicht im Inhalt enthalten sind. Nichttextliche Inhalte, wie Bilder oder Videos, können auf diese Weise mit Informationen angereichert werden, die die textuelle Suche erst ermöglichen.

Analog zum Tagging ist es auch denkbar, eine Kommentarfunktion anzubieten, die es Nutzern erlaubt, textuelle Hinweise und Feedback an Inhalten zu hinterlegen. Damit können sich Nutzer nicht nur mit dem Autor und anderen Lesern austauschen, die so gewonnenen Daten können auch helfen, die Qualität der Suchtreffer zu verbessern.

Ein weiteres häufig eingesetztes Instrument in Intranets ist eine Bewertungsfunktion für Inhalte. Die Umsetzung kann unterschiedlich gestaltet werden ‒ angefangen von einem einfachen “Gefällt mir”-Button wie in Facebook bis hin zu einer genaueren Einschätzung der Qualität mittels Sternen oder textuellem Feedback. Die so gewonnenen Daten eignen sich zur automatisierten Erzeugung von Listen mit besonders beliebten Inhalten, können aber auch in der Suche genutzt werden, um gut bewertete Inhalte auf den vorderen Plätzen der Trefferliste zu platzieren.

Die kollaborativ von den Nutzern gewonnenen Daten sollten also nicht isoliert betrachtet werden, sondern können – geschickt verknüpft – das Potential bieten, den Nutzer auf für ihn relevante Inhalte hinzuweisen und eine Suchlösung persönlicher zu machen. Durch eine soziale Komponente im Intranet können der Mitarbeiter und das Unternehmen nur gewinnen ‒ Voraussetzung hierbei ist natürlich der verantwortungsvolle Umgang mit den zum Teil persönlichen Daten.

Geht das nicht auch einfacher?
Eine gut konzipierte und technisch ausgefeilte konsolidierte Suche bringt unumstritten einen Mehrwert im Unternehmensumfeld und kann zu großen Einsparungen führen. Im ersten Schritt entstehen allerdings Kosten und Aufwand, den viele Firmen noch scheuen. Doch auch mit kleineren Budgets und ein wenig konzeptionellem Geschick lassen sich Lösungen mit Mehrwert umsetzen. So können Suchergebnisse aus verschiedenen Quellen in einer gemeinsamen Trefferliste zusammengeführt werden, ohne dass sie tatsächlich gemischt werden. Der Komfort und die Übersicht für den Nutzer bleiben erhalten. Auch Google macht von dem Ansatz regen Gebrauch, wie der folgende Screenshot zeigt.

beispiel_google.png

Quelle: google.de

Den Nutzern ist das Konzept auf diese Weise schon bekannt. Angepasst auf den Unternehmenseinsatz könnte eine Volltextsuche über das Unternehmensintranet um Treffer aus einer Bilddatenbank, einem Dokument-Management-System oder dem Mitarbeiterverzeichnis ergänzt werden.

Ausblick
Die Suche ist inzwischen zum Bindeglied zwischen zahlreichen Unternehmensanwendungen und Datenbanken geworden. Mit einer steigenden Anzahl von Datenquellen im Unternehmen kommt einer Lösung zur konsolidierten Suche eine besondere Rolle zu. Vor der Umsetzung sind viele konzeptionelle Fragen zu klären, damit das Ergebnis überzeugen und einen Mehrwert bringen kann. Suchlösungen werden in Zukunft sozialer und stellen den Nutzer stärker in den Mittelpunkt, denn dieser wird stärker mit den von ihm erarbeiteten Inhalten in Verbindung gebracht und so auch für seine Kollegen besser als Wissensträger erkennbar. Insbesondere im Social Workplace wird die Suche eine zentrale Komponente sein, die vorhandenes Wissen allen Mitarbeitern im Unternehmen zugänglich macht und auf diese Weise auch Verbindungen zwischen Wissensträgern im Unternehmen schafft.

Meine Erfahrungen in Projekten zeigen, dass die Suche inzwischen als Kernfunktion eines Intranets wahrgenommen und auch als Chance gesehen wird, Wissen im Unternehmen auffindbar und für jeden Mitarbeiter erreichbar zu machen. Leider wird das Produkt häufig vor die Frage nach der Art der Umsetzung gestellt und das Thema ausschließlich technisch diskutiert. Darüber hinaus muss man sich bewusst sein, dass die konsolidierte Suche ein Thema ist, das noch nicht allzu lange im Fokus der Hersteller liegt und technisch noch reifen muss. Dennoch können auch heute schon Lösungen entworfen werden, die einen echten Gewinn für das Unternehmen darstellen.

Abschließend noch eine Frage:
Welches Potential sehen Sie in Bezug auf Social Media im Intranet? Vielleicht haben Sie selbst schon eigene Erfahrungen mit Suchlösungen im Unternehmensumfeld gesammelt, die Sie gerne teilen möchten.

Linktipps:
Gute Anlaufstelle von T-Systems zur Suche im Unternehmensumfeld mit hervorragendem Whitepaper.
Blog zum Thema “enterprise search” allgemein
Was man von einer Lösung zur konsolidierten Suche nicht erwarten sollte
Schöne Präsentation von der http://www.enterprisesearchsummit.com/ mit einer Gegenüberstellung “Federated vs. Aggregated search Architectures