In einem spontanen Anflug von transatlantischem Geschichtssinn überfiel mich vor kurzem das Bedürfnis, eine meiner Bildungslücken mit lange überfälligem Wissen zu schließen. Objekt meiner Neugier war der US-Präsident Abraham Lincoln, den viele zumindest von der 5-Dollar-Note kennen. Weil man Biographien am besten vom Ende her aufzäumt, beschloss ich, bei seinem Ableben zu beginnen. Eine einfache Web-Suche nach „Lincolns Tod“ hielt ich für ausreichend, meinen Wissensdurst zu stillen. Kurioserweise lieferte die Websuchmaschine zu einem Treffer die folgende, völlig danebenliegende Vorschau: „Kim Jong Il ... bis zum Tod ... handelte es sich um einen Lincoln ...“ (s. DRadio-Wissensnachrichten vom 2011-12-29 und erster Link unten). Durchaus interessant, aber ich hatte weder nach dem unsäglichen Diktator noch nach amerikanischen Straßenkreuzern gesucht. Was war schief gelaufen?
Das Problem ist Mehrdeutigkeit. „Lincoln“ kann für eine Vielzahl von Dingen stehen, da das Wort mehrere Bedeutungen hat:
Für Menschen stellt das nur selten ein Problem dar. Mit verschiedenen Techniken disambiguieren (vereindeutigen) sie scheinbar mühelos solche mehrdeutigen Formulierungen, ohne wirklich darüber nachzudenken zu müssen. Zum einen hilft uns unser Hintergrundwissen. Uns ist bewusst, dass Kim Jong Il und der gesuchte Abraham Lincoln kaum etwas miteinander zu tun haben können, in zeitlicher, politischer, ideologischer oder geografischer Hinsicht. Noch viel wichtiger ist jedoch der Kontext und unsere sprachliche Kompetenz. Wenn man „X fährt einen Y“ hört, sagt uns unser Verständnis des Verbs „fahren“, dass sich das Objekt „einen Y“ in diesem Kontext auf keinen Menschen beziehen kann. Da ich jedoch nach einem Menschen gesucht habe, kann der vorgeschlagene Treffer mit Fokus auf den Lincoln des ehemaligen nordkoreanischen Diktators für mich logischerweise nicht relevant sein.
Traditionelle Suchmaschinen verfügen weder über Hintergrundwissen noch über sprachliche Kompetenz. „Lincoln“ ist nicht mehr als eine Kette aus sieben Zeichen und diese, das muss man der Maschine lassen, hat sie in dem mir vorgeschlagenen Internet-Dokument wiedergefunden. Ob mir damit geholfen ist, sei einmal dahingestellt. Die Frage, ob Lincoln eine Person, ein Auto, eine Stadt, eine Waschmaschine oder eine Ameisenart ist, stellt sich die Standard-Suchmaschine nicht.
Um dem Problem der Mehrdeutigkeit zu begegnen, muss eine Suchmaschine erst einmal erkennen, dass es sich bei „Lincoln“ überhaupt um ein problematisches Wort handelt. Und dazu ist nur eine intelligente Suchmaschine in der Lage. Ist ihr die Mehrdeutigkeit erst einmal bewusst, kann anhand des Kontextes eine Disambiguierung versucht werden. In meiner Suchanfrage „Lincolns Tod“ reicht das Wort „Tod“ im Grunde schon völlig aus, denn weder Städte noch Autos können sterben. Somit steht fest, dass es sich um den Menschen Lincoln handeln muss. Schon sind einige falsche Suchtreffer ausgeschlossen.
Auch clevere Suchmaschinen stoßen heute noch an Grenzen. Nehmen wir den Satz „Lincoln erklärt, dass ...“. In diesem Fall lässt sich zwar die Lesart als Automobil ausschließen, denn dieses kann nichts erklären. Doch eine Person (Abraham Lincoln), eine Stadt (Lincoln in Nebraska) oder ein Konzern (The Lincoln Motor Company) können das sehr wohl. Da hilft nur ein größerer Kontext. Oder man begnügt sich damit, dass zumindest eine falsche Lesart ausgeschlossen werden konnte (was schon maßgeblich zu besseren Suchergebnissen beiträgt).
Es wird Zeit, unseren Suchmaschinen mehr sprachliche Kompetenz zuzutrauen und diese Kompetenz von ihnen auch mehr und mehr zu erwarten.
Links zum Nachsuchen:
Bilder: © Fotolia
Hier können Sie einen Kommentar abgeben.
© 2009-2024 SEMPRIA GmbH, Datenschutz, Impressum ®: SEMPRIA ist eine eingetragene Wortmarke.
Kommentar von Lambert Schuster
Datum: 2016-04-06 08:42
Vielen Dank für diesen sehr schön geschriebenen und informativen Beitrag. Auf meiner Wissensdatenbank (Blog) ist die SEMPRIA-Suche installiert. Zum Nutzen der User. Probieren Sie es aus: https://lambertschuster.de/blog/
Vielen Dank an SEMPRIA: Lambert Schuster