Falls sich jemand fragt, warum ich gerade so viel Zeit in die semantische Kompression stecke:
England ruft Datenklimanotstand aus. Die Bevölkerung soll alte eMails, Bilder, Daten löschen … https://www.zeit.de/news/2025-08/13/duerre-menschen-in-england-sollen-alte-e-mails-loeschen
Mein gepostetes Modul kann nun Lexica für alle Sprachen der Leipzig Corpora Collection machen.
Das komprimierte Resultat ist unter 25% der ursprünglichen Größe.
Falls Ihr was besseres wisst oder interressiert seid, sagt doch Bescheid
#Datensparsamkeit #Komprimierung #Kompression
/ @acka47