Informationsextraktion aus unstrukturierten Daten

KI basierte Text-Mining-Techniken werden zur Gewinnung von Informationen aus Texten genutzt. Das führt unter anderem dazu, dass nicht mehr ganze Texte gelesen werden müssen, sondern die wichtigsten Informationen extrahiert werden können oder sogar zusammengefasst werden. Dies ist in allen Bereichen sinnvoll, in denen viele unstrukturierte Textdaten anfallen, die weiterverarbeitet oder analysiert werden müssen.

Image

Unstrukturierte Daten in Form von Freitext

E-Mails, Verträge, Berichte

Auch im Zeitalter der digitalen Transformation sind und bleiben die meisten Informationen, die im Tagesgeschäft ausgetauscht werden, unstrukturierte Daten, welche in den meisten Fällen in Form von Text vorliegen. Dazu gehören beispielsweise Kundendienst-E-Mails, Kundenfeedback, Verträge, Gesetze, Prozessbeschreibungen, Berichte etc.. Die Verarbeitung solcher Dokumente erfordert einen hohen manuellen Aufwand und ist ein kostenintensiver Faktor. Das bedeutet insbesondere, dass jede Verbesserung, die diesen Prozess etwas effizienter macht, bereits sehr wertvoll ist.

Ein Praxisbeispiel zeigt, dass im Kundenservice zählt jede Sekunde. Daher ist es für die Agenten von entscheidender Bedeutung, dass sie schnell verstehen, worum es bei einer E-Mail eines Kunden geht - und dass sie diese E-Mail zunächst an den richtigen Spezialisten weiterleiten. Darüber hinaus ist es sinnvoll, dass der Agent bereits wichtige Informationen wie Name und ID des Kunden aus der E-Mail extrahiert hat, was ihm zusätzliche Zeit spart. Die gewonnen Informationen aus den Texten können natürlich auch genutzt werden um weitere Prozesse automatisiert anzustoßen.

Die Kombination von verschiedenen NLP Konzepten als Lösung

Mit einer Kombination verschiedener NLP-Techniken können all diese Probleme angegangen werden. Über die Dokumentenklassifizierung kann der richtige Spezialist für ein Thema ausgewählt werden. Der Name und die ID des Kunden können über die Named-Entity-Erkennung extrahiert. In einigen Fällen kann es auch sinnvoll sein, die Stimmung einer E-Mail mit Hilfe der Sentiment Analysis zu extrahieren. Ein weiterer Anwendungsfall ist die automatische Extraktion von Informationen aus Berichten, um sie in einer strukturierten Datenbank verfügbar zu machen.