Die automatische Fragebeantwortung (question answering, QA) gewinnt seit einiger Zeit mehr und mehr an Bedeutung. Mit Fragebeantwortung ist gemeint, dass ein Computer die Frage eines Menschen automatisch auf Grundlage einer Textbasis oder Wissensbasis beantwortet. Statt Stichwörtern kann ein Nutzer eine Frage direkt in das Suchfeld eingeben. Die Vorteile einer solchen Vorgehensweise sind enorm. Sind Sie beispielsweise auf der Suche nach dem Gründungsjahr der Firma XY, könnte eine traditionelle Stichwortsuche so aussehen: „Gründung Firma XY“ oder „Gründungsjahr von XY“. Daraufhin würden Sie als Nutzer eine ganze Reihe an Texten erhalten, in denen Sie nach kurzem Überfliegen oder ausführlichem Lesen unter Umständen fündig werden. Doch damit hat die Suchmaschine Ihnen nur einen Teil der Arbeit abgenommen.
Durch ein integriertes Frage-Antwort-System kann die Suchmaschine gezielt Texte ausschließen, in denen es zwar um die Firma XY geht, nicht aber um das Gründungsjahr oder vielleicht bloß um den Gründungsort oder ähnliche verwandte, aber eben doch irrelevante Dinge. Eine große Anzahl von falschen Treffern kann so vermieden werden. Das Frage-Antwort-System kann außerdem die Antwort auf eine Eingabe wie „Wann wurde Firma XY gegründet?“ direkt aus dem Text extrahieren und in knapper Form präsentieren. Eine solche Suchmaschine findet nicht bloß Texte, in denen die gesuchte Information vielleicht enthalten ist, eine solche Suchmaschine findet Antworten.
Wie funktioniert das? Es gibt eine ganze Reihe verschiedener Ansätze, von denen wir an dieser Stelle jedoch nur einen genauer betrachten wollen. Durch unsere langjährige Erfahrung wissen wir, dass der tiefe semantische Ansatz der vielversprechendste und der längerfristig überlegene ist. Jeder Text in einer Textbasis (einem Archiv o.ä.) wird Satz für Satz in eine formale, präzise und eindeutige Bedeutungsdarstellung übersetzt. Mit diesen Bedeutungsdarstellungen kann der Computer arbeiten wie mit Zahlen oder anderen Datentypen. So können Schlussfolgerungen gezogen, ähnliche Texte entdeckt, passende Informationen gefunden, Stimmungen identifiziert, Widersprüche aufgedeckt und letztendlich Fragen beantwortet werden.
Bei einem tiefen semantischen Ansatz erfolgt ein Abgleich der Bedeutungsdarstellung einer eingegebenen Frage (inklusive Hunderter oder gar Tausender denkbarer Umformulierungen) mit Millionen von Bedeutungsdarstellungen, die aus der Textbasis generiert wurden. Dieses Verfahren ist sehr aufwändig, doch zugleich ausgesprochen mächtig. Aktuell ist eine derartige Suche für das gesamte Web noch nicht denkbar, aber die tiefe semantische Indexierung funktioniert für einzelne Web-Domänen und Archive bereits ganz ausgezeichnet und kann jederzeit beliebig erweitert werden. Zum Beispiel kann die Nutzung des in die Suchmaschine integrierten Frage-Antwort-Systems durch eine automatische Vervollständigung bei häufig gestellten Fragen (FAQ) noch weiter erleichtert werden. Beginnt man seine Eingabe mit einem Wa, We, Wi oder Wo (das sind genau die Anfänge typischer Fragen im Deutschen), dann erhält man häufige Fragen als Vorschlag.
Bei jedem Frage-Antwort-System ist aber zu bedenken, dass auch das fortschrittlichste Suchsystem nur so gut sein kann wie die hinterlegten Texte. Doch aus Erfahrung wissen wir, dass es in der Welt der Archive und der Content-Management-Systeme (CMS) viele Textgrundlagen gibt, die ideal durch eine Suchmaschine mit Frage-Antwort-System erschlossen werden können. Sie sind herzlich eingeladen, die Fragebeantwortungs-Funktion unserer Website zu nutzen, um das System einmal in Aktion zu erleben und sich dabei Antwort auf Fragen rund um die Firma SEMPRIA zu verschaffen.
Bild: © Fotolia
Hier können Sie einen Kommentar abgeben.
© 2009-2025 SEMPRIA GmbH, Datenschutz, Impressum ®: SEMPRIA ist eine eingetragene Wortmarke.