· Artikel · 2 min read
Named Entity Extraction mit ChatGPT
Named Entity Extraction ist eine Methode aus der Computerlinguistik, durch die Computer wichtige Informationen in Texten – wie Namen von Personen, Orten oder Organisationen – automatisch erkennen und herausfiltern können. Dabei funktioniert diese Technologie ähnlich einem Textmarker, der automatisch die relevanten Namen in Artikeln hervorhebt.
Ein paar mögliche Anwendungen
Verschlagwortung von Nachrichten
Beispiel-Prompt
Rolle: Du bist ein Computerlinguist und extrahierst Named Entities aus aus Texten
Kontext: „Die Europäische Zentralbank hat ihre Leitzinsen ein weiteres Mal erhöht. Ihre Präsidentin Christine Lagarde hat zugleich versichert, dass die EZ anders als die Federal Reserve in Washington nicht daran denkt, mit den Zinsschritten einzuhalten.“
Technisches Ausgabeformat: JSON Objekt der Form:
{ "entities“: [ { "type": "<type>", "value": <value>, "startPos": <index>, "endPos": <index> }] }
ChatGPT liefert uns ein JSON mit den extrahierten Informationen, den Typ wie Organisation oder Person und sogar die Position im Text.
Chatbot-Erkennung
Chatbots können damit erkennen, was ein Benutzer möchte und die Anfrage an die passenden Systeme weiterleiten.
Beispiel: Wenn du fragst, „Wie wird das Wetter morgen in Berlin?“, würde Named Entity Extraction den Begriff „Wetter“ als das Thema, „morgen“ als den Zeitpunkt und „Berlin“ als den Ort erkennen. Dann kann der Chatbot, basierend auf diesen Informationen, die richtige Antwort finden.
Terminplanung und Erinnerungen
Named Entity Extraction kann auch helfen, wichtige Termine und Veranstaltungen aus E-Mails, Nachrichten oder Texten automatisch zu erkennen und in deinen Kalender einzutragen.
Beispiel: In einer E-Mail steht „Vergiss nicht, dass wir uns am Freitag, den 14. Mai, um 12:30 Uhr zum Businesslunch treffen“. Named Entity Extraction würde das Datum „14. Mai“, die Uhrzeit „15:30 Uhr“ und den Anlass „Businesslunch“ identifizieren. Auf dieser Grundlage könnte ein Programm automatisch eine Erinnerung in deinem Kalender erstellen.
Named Entity Extraction bildet eine Brücke zwischen unstrukturiertem Text und strukturierter Information. Damit lassen sich diese Informationen optimal in Datenbanken und Suchmaschinen für einen schnellen, zielgerichteten Zugriff ablegen.
Abschließende Worte
Was mich bei meinen Analysen sehr beeindruckt hat, wie umfassend und exakt #OpenAI in der Lage ist Entitäten zu erkennen. Früher haben wir noch mir großen Schlagwortlisten und linguistischen Regeln arbeiten müssen. Dies scheint jetzt ein gelöstes Problem zu sein.