LISA! Sprachforschung – die kritische Masse
Freitag, 10. September 2010Entwicklerblog
Das LISA! Wörterbuch enthält sowohl den Grundwortschatz der deutschen Sprache, der aus Millionen von Textdokumenten herausgefiltert wurde, als auch zahlreiche Wortkombinationen. Auch kann man vollständige Sätze mit dem LISA! Wörterbuch in zahlreiche Sprachen übersezten lassen. Dabei werden die Übersetzungen von Teil-Sätzen und ganzen Sätzen immer besser und genauer je mehr Menschen das ‘LISA! Wörterbuch’ benutzen. Die Datenbank füllt sich bei hoher Benutzung, der Algorithmus lernt was falsch und richtig ist und kennt irgendwann auch “schöne Sätze”. Die kritische Masse wird erreicht, wenn unsere Sprachforschung alle Satzkombinationen erfasst hat und kennt, die mehrere Menschen gleich sprechen. Dann beginnt aber erst unsere richtige Arbeit, wir müssen den Algorithmus so programmieren, dass er den Sinn eines Textes versteht und nicht nur die Übersetzung einzelner Wörter oder Satzteile kennt. Um diesem Ziel näher zu kommen, arbeitet ab September eine neue Medien- und Sprachwissenschaftlerin in unserem Team, die ihre Erfahrungen aus der Arbeit an der Hochschule Ilmenau und dem Frauenhofer Institut mitbringt.