UTF-8
UTF-8 sorgt dafür, dass Schriftzeichen durch eine kodierte Bytekette repräsentiert werden.
Je länger dieses Multibyte ist, desto mehr Schriftzeichen können dargestellt werden.
UTF bedeutet
Unicode Translation Format,
was eben diese Konvertierung vom Multibyte zum interpretierten Schriftzeichen meint.
So kann
UTF-8 (RFC 3629 / ISO 10646-1) in einer theoretisch maximalen Sequenz von 6 Bytes
(+2 vorangestellte Bytes zur Kontrolle / Parität) fast alle global vorkommenden Schriftzeichen anzeigen. Für Ihren Auftritt bedeutet dies, dass selbst außergewöhnliche Schriftzeichen, wie jene der japanischen Zeichenfamilien, schnell und unproblematisch eingebettet werden können.
UTF-8 wurde 1992 von Ken Thompson und Rob Pike entwickelt und basiert auf der Maßgabe, eine Transformation des
Universal Character Set (UCS) im Plan9 Betriebssystem zu ermöglichen.
Die Verbreitung des Internet und die damit verbundene Globalisierung des Welthandels haben die Bedeutung und Rolle von UTF-8 bei der Generalisierung von Schriftzeichensystemen maximiert. Noch heute werden auf Lokalisierungen (L10N) basierende Programme auf UTF-8 umgestellt, um diese durch Internationalisierung (I18N) zukunftssicher zu gestalten.