Webdesign Blog

Automatische Ãœbersetzung von deutschen Umlauten in Links in HTML Dokumenten

Heute ist mir wieder mal ein (potenzieller?) Bug in Internet Explorer aufgefallen:

– Das Dokument ist im ISO-8859-1 Zeichensatz geschrieben. Der HTTP-Header sowie die META-Angabe zu Content-Type spezifizieren ausdrÃ¼cklich ISO-8859-1.

– Der Link enthÃ¤lt in der URL einen deutschen Umlaut (ebenfalls ISO-8859-1 codiert; jedoch kein URL-Encoding).

Firefox konvertiert das „Ã¼“ beim Klick richtig nach „%FC“, der Latin1 Version in URL-Encoding.

Internet Explorer und Opera hingegen verwenden die UNICODE-Version „%C3%BC“.

Meinem GefÃ¼hl nach verhÃ¤lt sich hier demnach Firefox richtig, zumal nach Umstellung des Dokuments auf UTF-8 Firefox ebenfalls die UTF-Version des URL-Encoding verwendet.

Davon abgesehen liegt der Fehler vermutlich bei mir – ich sollte die Zeichen vorcodieren, dann stellt sich die Zeichensatz-Frage fÃ¼r den Browser erst gar nicht. Mal in den Standard-Dokumenten nachsehen – irgendwann…

Anmerkung: Folgende Begriffe sind Ã¤quivalent:
Latin 1 = ISO-8859-1
UTF-8 = UNICODE
—
Manuel

Der Beitrag wurde am Donnerstag, den 11. Januar 2007 um 16:04 Uhr veröffentlicht und wurde unter Programmierung abgelegt. Du kannst die Kommentare zu diesen Eintrag durch den RSS 2.0 Feed verfolgen. Kommentare und Pings sind derzeit nicht erlaubt.

4 Reaktionen zu “Automatische Ãœbersetzung von deutschen Umlauten in Links in HTML Dokumenten”

Thomas Urban
Am 7. März 2007 um 13:25 Uhr
Hallo,

kleine Korrektur … man mag mir KrÃ¼melkackerei vorwerfen: UTF-8 und Unicode sind wahrlich nicht _Ã¤quivalent_.

Unicode ist vielerlei – eine Idee, vielleicht noch eine Organisation oder gar Ausdruck fÃ¼r die Masse aller Zeichen, die weltweit auf IT-Anlagen darstellbar sein sollten. UTF-8 ist eine konkrete Form der Kodierung, um diese Zeichen technisch zu reprÃ¤sentieren.

Oder banaler widerlegt: wenn UTF-8=Unicode und (zweifelsohne dann auch) UTF-16=Unicode und UTF-32=Unicode, dann auch UTF-8=UTF-16=UTF-32, was aber nicht zutrifft.
Johannes Freund
Am 16. September 2007 um 21:32 Uhr
WÃ¤re super wenn Du die LÃ¶sung verÃ¶ffentlichen wÃ¼rdest.
Ich habe das gleiche Problem (Safari kodiert auch falsch) und wÃ¤re sehr froh eine LÃ¶sung zu finden.
MfG Johannes Freund
M.Hirsch
Am 17. September 2007 um 10:29 Uhr
Hallo Johannes,

ich habe die Software dann so umgeschrieben, dass sie durchgehend UTF-8 verwendet. So funktioniert’s in allen Browsern, die wir getestet haben.

Aber:
Inzwischen schreibe ich die Umlaute aus. Also „Ã¤“->“ae“ usw, da sich weiterhin Probleme mit RSS-Readern und -Verzeichnissen sowie auf Websites, die uns verlinken, ergeben haben.

Ich wÃ¼rde die Langform empfehlen, um auf Nummer Sicher zu gehen.

Hallo Thomas,
hast natÃ¼rlich recht. Eigentlich lege ich auch Wert auf die richtige Verwendung von Fachbegriffen. Werd mich bessern 😉
M.Hirsch
Am 24. Oktober 2008 um 10:31 Uhr
Kleiner Nachtrag. Ich bin in anderem Zusammenhang nun Ã¼ber den passenden Teil der Spezifikation zum Thema gestolpert.

Das Verhalten von Internet Explorer ist in diesem Fall korrekt.

http://www.w3.org/TR/REC-html40/appendix/notes.html#non-ascii-chars

Automatische Ãœbersetzung von deutschen Umlauten in Links in HTML Dokumenten

4 Reaktionen zu “Automatische Ãœbersetzung von deutschen Umlauten in Links in HTML Dokumenten”

Archiv

Kategorien

Die aktuellsten Beiträge

Vorherige Beiträge