Dies ist eine gute Erkenntnis für Managerinnen und Product Ownerinnen, vor allem für diejenigen, die virtuelle Sprachassistenten und immersive Spracherlebnisse für ihre Nutzerinnen schaffen wollen. Nicht alle NLP-Entwicklerinnen (NLP: natural language processing) sind auch gut im Entwickeln von NLUs. Sicherlich ist eine gut entwickelte Pipeline in einem erstellten Sprachmodell wichtig, aber das bedeutet nicht, dass eine NLP-Entwicklerin automatisch über umfangreiches linguistisches Wissen über eine bestimmte Sprache verfügt.
Wenn man Standardchinesisch und Englisch vergleicht, mag beispielsweise die Syntax ähnlich sein: Ein Satz besteht in beiden Sprachen aus Subjekt und Verb. Aber die chinesische Sprache ist sehr arm an Morphologie und was das Standardchinesische noch komplizierter macht, ist, dass sie eine riesige Menge an Homophonen enthält (Wörter, die die gleiche Aussprache, aber unterschiedliche Bedeutungen haben, zum Beispiel „Mathe“ und „Matte“ im Deutschen).
Außerdem ist Chinesisch eine ideografische Sprache, bei der ein Zeichen die Bedeutung repräsentieren kann, ohne die Aussprache wiederzugeben, daher kann dieselbe gesprochene Silbe durch eines von vielen Zeichen dargestellt werden, je nach Bedeutung. Ein bestimmtes Zeichen kann auch eine Reihe von Bedeutungen haben, oder manchmal ganz unterschiedliche Bedeutungen, die unterschiedlich ausgesprochen werden können. Ohne Zeichen repräsentiert der Klang selbst nicht unbedingt die Semantik, die Bedeutung des Wortes. Englischsprachige Entwickler*innen sind also nicht in der Lage, ihr Wissen einfach auf eine chinesische NLU-Entwicklung zu übertragen.
Ein anderes Beispiel wären agglutinierende Sprachen wie Japanisch, wo grammatische und semantische Funktionen durch Affixe gekennzeichnet werden. Im Deutschen gibt es das auch, beispielsweise verändert das Präfix an- die Wortbedeutung von Verben: gehen und angehen, machen und anmachen. Im Japanischen können Affixe die Verbbedeutung von Aktiv zu Passiv verändern (das Deutsche benötigt dafür beispielsweise fast immer Hilfsverben: massieren – massiert werden). Hier ein japanisches Beispiel: