Yakabikaj [Yâ Kabîkatsch]
Warum können digitale Endgeräte so schlecht Arabisch?
Die digitale Codierung arabischer Schriftzeichen ist generell gesprochen, ergo auch im Internet, ein großes Chaos. Das liegt einerseits daran, dass in Unicode für das identische arabische Schriftzeichen mehrere Codierungen hinterlegt sind, und andererseits daran, dass das System dieser Codierungen vor dem Hintergrund lateinischer Blockbuchstaben entwickelt wurde, womit das Arabische inkompatibel ist. Das Resultat: einfache Internetsuchen auf Arabisch sind extrem zufallsabhängig und etwas komplexere Suchen tendenziell sinnlos.
In Zusammenarbeit mit der Firma decotype wurde an der UHH ein Algorithmus entwickelt, der diese Probleme auffängt: Yakabikaj (spricht man Yâ Kabîkatsch). Er wurde im COBHUNI-Projekt zusammen mit Tom Milo entwickelt und bereits auf drei Kontinenten der Öffentlichkeit vorgestellt (einschließlich Unicode Conference, Santa Clara, CA). Dieser Algorithmus muss nun weiter getestet werden. Das Projekt zielt darauf, die Voraussetzungen für solche umfangreicheren Testungen zu verbessern.
Transferprojekt 'Yakabikaj [Yâ Kabîkatsch]'
- Projektleitung Prof. Dr. Thomas Eich
- Asien-Afrika-Wissenschaften, Fakultät für Geisteswissenschaften
- COBHUNI Presentations