Die Zeiten ändern sich schnell

Dieser Artikel ist älter als 8 Jahre — im Internet eine sehr lange Zeit. Eventuell ist der Inhalt beziehungsweise sind die getroffenen Aussagen nicht mehr aktuell.

Sonderzeichen in (X)HTML

Sicherlich haben Sie schon mal bemerkt, dass Sie auf eine Seite gesurft sind, und dort einige Zeichen nicht korrekt dargestellt wurden. Dies liegt daran, dass früher zunächst einmal nur der ASCII-Zeichensatz von den Browsern umgesetzt werden konnte. Inzwischen kann eigentlich jedes Zeichen, welches im Unicode-Standard (deckungsgleich mit ISO 10646) verwendet werden kann. Normalerweise wird im Kopfbereich einer HTML-Datei in den Meta-Angaben festgelegt, welcher Zeichensatz verwendet werden soll.

Unterschiedliche Sonderzeichen

Landesspezifische Sonderzeichen

Dennoch gehen Browser und Betriebssystem unterschiedlich mit Zeichen um. Probleme machen dabei vor allem immer die landestypischen Sonderzeichen. Dies gilt nicht nur für die deutschen Sonderzeichen ä,ü,ö und ß, sondern auch für französische (z.B. é,è,á oder à) oder skandinavische (z.B. Ð (isländisch) oder ø).

Nicht-Landesspezifische Sonderzeichen

Aber nicht nur landesspezifische Sonderzeichen, sondern auch bestimmte andere Zeichen, wie z.B. €, ©, ¢, § ® oder ¼ können nicht ohne weiteres dargestellt werden. Hinzu kommen dann noch Zeichen, die speziell für HTML selbst benötigt werden (<, >, “ und &).

Sonderzeichen

Sonderzeichen


Wie kann man nun dafür Sorge tragen, dass diese Zeichen dennoch überall gleich in den Browsern dargestellt werden? Hierfür wurde bereits in den früheren Versionen von HTML sogenannte Entities zur Verfügung gestellt. Dies bedeutet, dass ein Zeichen durch eine bestimmte andere Zeichenfolge im HTML-Quellcode ersetzt wird. Diese Zeichenfolge wird von allen Browsern verstanden und bei der Anzeige in die richtigen Zeichen umgewandelt. Hierzu wird eine numerische Notation verwendet. Damit man nun erkennen kann, dass es sich um eine Nummer einer Entity und nicht um eine Zahl im Text handelt, wird die numerische Notation zwischen ein & und ein ; gesetzt. Soll die Nummer nicht dezimal sondern hexadezimal dargestellt werden, muss nach dem & noch ein x notiert werden. Welche Nummern für die Zeichen benötigt werden, kann man aus dem Unicodesystem ableiten.
Man kann also z.B. den griechischen Buchstaben Alpha als &#945; oder &#x3B1; darstellen. Da nun die wenigsten die Nummern für all die Sonderzeichen, die man so benötigt, im Kopf haben, gibt es für die häufig gebrauchten auch sogenannte named entities, benannte Zeichen. Anstelle der Nummer wird zwischen & und dem ; ein Name gesetzt, den man sich leichter merken kann. Für das Alpha kann man anstatt &#945; oder &#x3B1; auch &alpha; schreiben.

Liste der Sonderzeichen

Im folgenden finden Sie eine Tabelle mit Sonderzeichen, die man immer wieder benötigt.

Benannte Zeichen für HTML-eigene Zeichen

Zeichen Beschreibung Name in HTML Unicode in HTML
Anführungszeichen oben &quot; &#34;
& Ampersand-Zeichen, kaufmännisches Und &amp; &#38;
< öffnende spitze Klammer &lt; &#60;
> schließende spitze Klammer &gt; &#62;

Die deutschen Sonderzeichen

Zeichen Ersetzung
ä &auml;
Ä &Auml;
ö &ouml;
Ö &Ouml;
ü &uuml;
Ü &Uuml;
ß &szlig;

Benannte Zeichen für die Kodierung ISO 8859-1

Zeichen Beschreibung Name in HTML Unicode in HTML
Erzwungenes Leerzeichen &nbsp; &#160;
¡ umgekehrtes Ausrufezeichen &iexcl; &#161;
¢ Cent-Zeichen &cent; &#162;
£ Pfund-Zeichen &pound; &#163;
¤ Währungszeichen &curren; &#164;
¥ Yen-Zeichen &yen; &#165;
¦ durchbrochener Strich &brvbar; &#166;
§ Paragraph-Zeichen &sect; &#167;
¨ Pünktchen oben &uml; &#168;
© Copyright-Zeichen &copy; &#169;
ª Ordinal-Zeichen weiblich &ordf; &#170;
« angewinkelte Anführungszeichen links &laquo; &#171;
¬ Verneinungs-Zeichen &not; &#172;
­ bedingter Trennstrich &shy; &#173;
® Registriermarke-Zeichen &reg; &#174;
¯ Überstrich &macr; &#175;
° Grad-Zeichen &deg; &#176;
± Plusminus-Zeichen &plusmn; &#177;
² Hoch-2-Zeichen &sup2; &#178;
³ Hoch-3-Zeichen &sup3; &#179;
´ Akut-Zeichen &acute; &#180;
µ Mikro-Zeichen &micro; &#181;
Absatz-Zeichen &para; &#182;
· Mittelpunkt &middot; &#183;
¸ Häkchen unten &cedil; &#184;
¹ Hoch-1-Zeichen &sup1; &#185;
º Ordinal-Zeichen männlich &ordm; &#186;
» angewinkelte Anführungszeichen rechts &raquo; &#187;
¼ ein Viertel &frac14; &#188;
½ ein Halb &frac12; &#189;
¾ drei Viertel &frac34; &#190;
¿ umgekehrtes Fragezeichen &iquest; &#191;
À A mit accent grave (Gravis) &Agrave; &#192;
Á A mit accent aigu (Akut) &Aacute; &#193;
 A mit Zirkumflex &Acirc; &#194;
à A mit Tilde &Atilde; &#195;
Ä A Umlaut &Auml; &#196;
Å A mit Ring &Aring; &#197;
Æ A mit legiertem E &AElig; &#198;
Ç C mit Häkchen &Ccedil; &#199;
È E mit accent grave (Gravis) &Egrave; &#200;
É E mit accent aigu (Akut) &Eacute; &#201;
Ê E mit Zirkumflex &Ecirc; &#202;
Ë E Umlaut &Euml; &#203;
Ì I mit accent grave (Gravis) &Igrave; &#204;
Í I mit accent aigu (Akut) &Iacute; &#205;
Î I mit Zirkumflex &Icirc; &#206;
Ï I Umlaut &Iuml; &#207;
Ð großes Eth (isländisch) &ETH; &#208;
Ñ N mit Tilde &Ntilde; &#209;
Ò O mit accent grave (Gravis) &Ograve; &#210;
Ó O mit accent aigu (Akut) &Oacute; &#211;
Ô O mit Zirkumflex &Ocirc; &#212;
Õ O mit Tilde &Otilde; &#213;
Ö O Umlaut &Ouml; &#214;
× Mal-Zeichen &times; &#215;
Ø O mit Schrägstrich &Oslash; &#216;
Ù U mit accent grave (Gravis) &Ugrave; &#217;
Ú U mit accent aigu (Akut) &Uacute; &#218;
Û U mit Zirkumflex &Ucirc; &#219;
Ü U Umlaut &Uuml; &#220;
Ý Y mit accent aigu (Akut) &Yacute; &#221;
Þ großes Thorn (isländisch) &THORN; &#222;
ß scharfes S &szlig; &#223;
à a mit accent grave (Gravis) &agrave; &#224;
á a mit accent aigu (Akut) &aacute; &#225;
â a mit Zirkumflex &acirc; &#226;
ã a mit Tilde &atilde; &#227;
ä a Umlaut &auml; &#228;
å a mit Ring &aring; &#229;
æ a mit legiertem e &aelig; &#230;
ç c mit Häkchen &ccedil; &#231;
è e mit accent grave (Gravis) &egrave; &#232;
é e mit accent aigu (Akut) &eacute; &#233;
ê e mit Zirkumflex &ecirc; &#234;
ë e Umlaut &euml; &#235;
ì i mit accent grave (Gravis) &igrave; &#236;
í i mit accent aigu (Akut) &iacute; &#237;
î i mit Zirkumflex &icirc; &#238;
ï i Umlaut &iuml; &#239;
ð kleines Eth (isländisch) &eth; &#240;
ñ n mit Tilde &ntilde; &#241;
ò o mit accent grave (Gravis) &ograve; &#242;
ó o mit accent aigu (Akut) &oacute; &#243;
ô o mit Zirkumflex &ocirc; &#244;
õ o mit Tilde &otilde; &#245;
ö o Umlaut &ouml; &#246;
÷ Divisions-Zeichen &divide; &#247;
ø o mit Schrägstrich &oslash; &#248;
ù u mit accent grave (Gravis) &ugrave; &#249;
ú u mit accent aigu (Akut) &uacute; &#250;
û u mit Zirkumflex &ucirc; &#251;
ü u Umlaut &uuml; &#252;
ý y mit accent aigu (Akut) &yacute; &#253;
þ kleines Thorn (isländisch) &thorn; &#254;
ÿ y Umlaut &yuml; &#255;

Dies dürften die wichtigsten Zeichen gewesen sein — zumindest für den normalen Webautor. Sicherlich gibt es noch weitere Zeichen z.B. für griechische Buchstaben, mathematische Symbole, technische Symbole, Pfeil-Symbole, lateinisch erweiterte, Zeichen für Interpunktion und diakritische Zeichen. Diese kann man z.B. bei selfHTML oder bei Wikipedia nachlesen.

Ich benutzte als Quellen: http://de.selfhtml.org/html/referenz/zeichen.htm, http://www.aconcagua2000.de/html/sonderzeichen.html und die deutsche Wikipedia: Seite „Zeichen-Entität-Referenz“. In: Wikipedia, Die freie Enzyklopädie. Bearbeitungsstand: 10. November 2008, 22:06 UTC. URL: http://de.wikipedia.org/w/index.php?title=Zeichen-Entit%C3%A4t-Referenz&oldid=52855967 (Abgerufen: 30. Dezember 2008, 18:52 UTC) .

Marc Koschel

Über Marc Koschel

Fotograf • Musikhörer • Blogger • Denker • Kaffeetrinker
— Marc Koschel lebt bei Mannheim und bloggt seit 2001 über digitale Workflows

Dieser Unterhaltung fehlt Ihre Stimme

Ein Kommentar bisher

1. Pingback

Avatar

Tutorial: Einsteigerseminar (Teil 2) - koschel.IT
30. Dezember 2008 um 19:59

[…] Auch für die deutschen Umlaute Ä, ä, Ü, ü, Ö, ö und dem ß sowie anderen europäischen Sonderzeichen müssen benannte Zeichen verwendet werden. Eine Liste mit Sonderzeichen finden Sie bei mir im Beitrag Sonderzeichen in (X)HTML […]