KI-Erkennungssoftware / Plagiatsoftware
Da LLMs auf riesigen Textkorpora trainiert werden und auf statistische Regelmäßigkeiten reagieren, neigen sie dazu, immer wieder dieselben Ausdrucksmuster zu verwenden – besonders solche, die in den Trainingsdaten stark vertreten waren. Diese Wiederholungen können bei genauerer Betrachtung eine gewisse Uniformität und Vorhersehbarkeit erkennen lassen.
Relative Häufigkeit der KI-Formulierungen
Die KI-Erkennungssoftware macht sich genau diesen Unterschied zunutze. Sie analysiert den hochgeladenen Text auf charakteristische Häufungen solcher KI-typischer Strukturen und vergleicht sie mit einer umfangreichen Datenbasis natürlicher und maschinell erzeugter Texte. Formulierungen, die signifikant häufiger in KI-generierten Texten vorkommen, werden im Text farblich rot markiert. Dabei berücksichtigt das System sowohl die relative Häufigkeit innerhalb des Textes als auch die sogenannte Relevanz einer Formulierung. Die Relevanz gibt an, wie stark eine bestimmte Wortkombination in typischen KI-Texten überrepräsentiert ist.
Visuelles Ergebnis der Auswertung
Durch diese Kombination aus quantitativer Analyse (Häufigkeit) und qualitativer Gewichtung (Relevanz) entsteht ein aussagekräftiges Bild darüber, inwieweit ein Text auf maschineller Generierung beruhen könnte. Die Nutzerinnen und Nutzer erhalten dadurch nicht nur eine einfache Ja/Nein-Aussage, sondern eine nachvollziehbare visuelle Rückmeldung über die auffälligen Stellen im Text:
von Grün - unverdächtig bis Rot - KI-ähnlich.