Discussion
Loading...

Post

  • About
  • Code of conduct
  • Privacy
  • Users
  • Instances
  • About Bonfire
Sebastian Lasse
@sl007@digitalcourage.social  ·  activity timestamp 2 months ago

Yay - wir haben nun bei der @digitalcourage Instanz das #mastodon Update. Offenbar wurde meine Anregung zur automatischen Spracherkennung beim Schreiben umgesetzt. Yay.

Falls es jemand interessiert, habe ich fingerprints für 852 natürliche Sprachen und Programmiersprachen hier: https://github.com/redaktor/languages
Die Idee bei unserer fedi software ist abgesehen vom serverseitigen parsen:
- Actor definiert, welche Sprachen verstande werden.
- Client bekommt Ausschnitt der fingerprints.
- Browser kann die zuverlässig erkennen.

  • Copy link
  • Flag this post
  • Block
GeoRg
@MrGR@mastodon.social replied  ·  activity timestamp 2 months ago
@sl007 ist #Esperanto auch dabei? @digitalcourage
  • Copy link
  • Flag this comment
  • Block
Sebastian Lasse
@sl007@digitalcourage.social replied  ·  activity timestamp 2 months ago
@MrGR
selbstverständlich.
Das hatte ich noch etwas angepasst, die Abgrenzung ist womöglich etwas "weniger" (so 8-10% zur nächstgerankten vermutl. romanischen Sprache)
@digitalcourage
  • Copy link
  • Flag this comment
  • Block
Tom Wieczorek
@twz123@floss.social replied  ·  activity timestamp 2 months ago
@sl007 Wo kommen denn die ganzen Trigramme für die 800 Sprachen her 😳
  • Copy link
  • Flag this comment
  • Block
Sebastian Lasse
@sl007@digitalcourage.social replied  ·  activity timestamp 2 months ago
@twz123

phew, es ist ein mix aus wipedia (ausgehend von wikidata / SPARQL) und
verschiedenen Oxford Corpi und bei Sprachen, die mir wichtig waren [aber nur noch wenig gesprochen werden, z. B. in Ozeanien] auch lokalen Quellen.
Es sind halt auch Trigramme, die so erstmal nur für Erkennung genutzt werden sollten.
Momentan arbeite ich an semantischer Kompression (en/de/fr/es/pt), da kommt was anderes raus.

  • Copy link
  • Flag this comment
  • Block
Log in

bonfire.cafe

A space for Bonfire maintainers and contributors to communicate

bonfire.cafe: About · Code of conduct · Privacy · Users · Instances
Bonfire social · 1.0.0-rc.3.1 no JS en
Automatic federation enabled
  • Explore
  • About
  • Members
  • Code of Conduct
Home
Login