· Artikel  · 2 min read

Named Entity Extraction mit ChatGPT

Named Entity Extraction ist eine Methode aus der Computerlinguistik, durch die Computer wichtige Informationen in Texten – wie Namen von Personen, Orten oder Organisationen – automatisch erkennen und herausfiltern können. Dabei funktioniert diese Technologie ähnlich einem Textmarker, der automatisch die relevanten Namen in Artikeln hervorhebt.

Ein paar mögliche Anwendungen

Verschlagwortung von Nachrichten

Beispiel-Prompt

  • Rolle: Du bist ein Computerlinguist und extrahierst Named Entities aus aus Texten

  • Kontext: „Die Europäische Zentralbank hat ihre Leitzinsen ein weiteres Mal erhöht. Ihre Präsidentin Christine Lagarde hat zugleich versichert, dass die EZ anders als die Federal Reserve in Washington nicht daran denkt, mit den Zinsschritten einzuhalten.“

  • Technisches Ausgabeformat: JSON Objekt der Form:

     { "entities“: [
       {
         "type": "<type>",
         "value": <value>,
         "startPos": <index>,
         "endPos": <index>
       }]
     }
    

ChatGPT liefert uns ein JSON mit den extrahierten Informationen, den Typ wie Organisation oder Person und sogar die Position im Text.

Chatbot-Erkennung

Chatbots können damit erkennen, was ein Benutzer möchte und die Anfrage an die passenden Systeme weiterleiten.

Beispiel: Wenn du fragst, „Wie wird das Wetter morgen in Berlin?“, würde Named Entity Extraction den Begriff „Wetter“ als das Thema, „morgen“ als den Zeitpunkt und „Berlin“ als den Ort erkennen. Dann kann der Chatbot, basierend auf diesen Informationen, die richtige Antwort finden.

Terminplanung und Erinnerungen

Named Entity Extraction kann auch helfen, wichtige Termine und Veranstaltungen aus E-Mails, Nachrichten oder Texten automatisch zu erkennen und in deinen Kalender einzutragen.

Beispiel: In einer E-Mail steht „Vergiss nicht, dass wir uns am Freitag, den 14. Mai, um 12:30 Uhr zum Businesslunch treffen“. Named Entity Extraction würde das Datum „14. Mai“, die Uhrzeit „15:30 Uhr“ und den Anlass „Businesslunch“ identifizieren. Auf dieser Grundlage könnte ein Programm automatisch eine Erinnerung in deinem Kalender erstellen.

Named Entity Extraction bildet eine Brücke zwischen unstrukturiertem Text und strukturierter Information. Damit lassen sich diese Informationen optimal in Datenbanken und Suchmaschinen für einen schnellen, zielgerichteten Zugriff ablegen.

Abschließende Worte

Was mich bei meinen Analysen sehr beeindruckt hat, wie umfassend und exakt #OpenAI in der Lage ist Entitäten zu erkennen. Früher haben wir noch mir großen Schlagwortlisten und linguistischen Regeln arbeiten müssen. Dies scheint jetzt ein gelöstes Problem zu sein.

Share:
Back to Blog

Related Posts

View All Posts »
LLM Report 2024

LLM Report 2024

Künstliche Sprachintelligenz zwischen Hype und Realität: Einblicke aus der Praxis