SAXEED Blog

NLP-Start-up T2K – KI versteht und verbessert Texte

Haben auch Sie im Deutschunterricht in der Schule Satzglieder bestimmt: Subjekt, Prädikat, Objekt, …? Und hätten Sie damals gedacht, dass es Computerprogramme gibt, die genau das viel schneller als ein Mensch und vollautomatisch erledigen können? „Die Syntaxanalyse, Parsing genannt, ist ein Teilgebiet der Computerlinguistik, die sich mit der automatischen Analyse und Verarbeitung von Sprachdaten befasst“, sagt die Computerlinguistin Dr. Anne-Kathrin Schumann (36). „Computerlinguistische Algorithmen stecken in vielen Programmen, die wir täglich verwenden, beispielsweise im Google-Übersetzer oder in der Rechtschreibprüfung.“

Gemeinsam mit ihren Kollegen Martin Rosenbusch (38) und Liliia Diriavka (26) arbeitet Anne-Kathrin Schumann an der Gründung des computerlinguistischen Start-ups „T2K: Text to Knowledge“. Mit Hilfe statistischer und neuronaler Algorithmen will T2K das in Texten versprachlichte Wissen erkennen, extrahieren und für weitergehende Analysen bereitstellen. „Für den Computer ist jeder Text ja erstmal nur ein String, d. h. eine Zeichenkette. Welche Bestandteile des Textes die wirklich wichtigen sind, wo die Hauptinformation steckt und was sie aussagt und welche Abschnitte redundant oder sinnlos sind, das kann der Computer nicht erkennen“, erläutert Anne-Kathrin Schumann. „Wir nutzen Methoden der Künstlichen Intelligenz, um dem Computer beizubringen, Texte annähernd so zu analysieren, wie Menschen es jeden Tag tun. Beispielsweise können wir Eigennamen, wichtige Begriffe und die Emotion, die ein Text zum Ausdruck bringt, automatisch erkennen“, so Schumann.

Und wozu das Ganze? „Bei T2K geht es uns darum, die textbasierte Wissensarbeit durch intelligente Software zu unterstützen“, hakt Martin Rosenbusch ein, der kaufmännische Leiter von T2K. „Viele Menschen haben beispielsweise Schwierigkeiten mit dem Schreiben von Texten. Andere wiederum benötigen Unterstützung bei der Organisation des Wissens, das in Texten steckt. Und wieder andere wünschen sich eine Software, die schnell viele Texte durchsucht und die in ihnen enthaltenen Informationen automatisch in einen Bericht überführt“, sagt Rosenbusch. Und weiter: „Unsere Vision ist es, T2K zu einem der weltweit führenden Unternehmen in diesem Bereich zu machen – mit Sitz in Sachsen.“

Um diesen Plan zu erfüllen, arbeiten die Gründer von T2K gerade mit Hochdruck an einer computerlinguistischen Software, die verschiedene textbasierte Anwendungsfälle unterstützt. Zum Beispiel das Schreiben von Texten: „T2K erkennt die Qualität von Texten, bewertet sie und macht Verbesserungsvorschläge. Keyword- und Formulierungsempfehlungen ermöglichen die Abgrenzung von der Konkurrenz“, erläutert Anne-Kathrin Schumann. „Aber wir beschäftigen uns auch mit dem Thema neuronale Suche. Und nicht zuletzt wollen wir die Computerlinguistik für eine echte Wissensextraktion nutzen und Texte analysieren, um Konkurrenten am Markt zu identifizieren und Trends zu erkennen“, ergänzt Martin Rosenbusch. Anwendung finden kann die T2K-Software in Marketing-, SEO- und Textagenturen, die ihren Umgang mit Texten verbessern wollen. Auch Analysten, die große Textbestände automatisiert auswerten wollen, und IT-Experten, die computerlinguistische Technologien nutzen und weiterentwickeln möchten, sollen von der Innovation profitieren.

T2K wird im Rahmen des EXIST-Gründerstipendiums des Bundesministeriums für Wirtschaft und Energie gefördert. Unterstützung in Form von Beratung, Kontaktvermittlung und Hilfe in der praktischen Abwicklung der Stipendienformalitäten erhält T2K durch das Gründernetzwerk SAXEED an der TU Bergakademie Freiberg.

Und was haben die Gründer von T2K als nächstes vor? „Wir arbeiten mit Pilotpartnern aus verschiedenen Branchen an der Einführung unserer Produkte in den Markt. Das Interesse an computerlinguistischen Technologien ist sehr groß, weil intelligente Sprachsysteme große Potenziale mit sich bringen“, sagt Martin Rosenbusch. „Wir glauben, dass jeder T2K braucht.

 

Das Interview führte Jana Mitschke.

Foto: T2K