was bedeutet meta charset="utf-8"?

7 Antworten

Dies legt die Zeichenkodierung des HTML-Dokuments fest. Die Angabe wird allerdings möglicherweise ignoriert, wenn andere Angaben an anderer Stelle vorhanden sind oder wenn das Dokument als XML-Datei geparst wird.

Siehe auch:

https://wiki.selfhtml.org/wiki/HTML/Kopfdaten/meta#Zeichencodierung

https://www.w3.org/International/questions/qa-html-encoding-declarations.de

Normalerweise musst du statt ä ä ü ü statt ö ö und statt ß ß schreiben.

Mit dieser Zeile kannst du einfach auch ö, ä, ü und ß nutzen.

Das liegt daran, dass diese Zeichen in der UTF8 Codierung vorhanden sind :) Im ASCII Zeichensatz, der ansonsten verwendet wird, sind diese Zeichen nicht vorhanden. ASCII kommt aus Amerika und in Amerika hat man kein ä, ö, ü, ß

Eine Codierung gibt an wie ein Zeichensatz (also eine Menge an Zeichen) mithilfe eines anderen Zeichensatzes dargestellt werden kann. Der Computer kann intern nur Binärzahlen (also 0en und 1en) nutzen. Da gibt es dann unterschiedliche Zeichensätze die definieren, was für ein Zeichen es ist, wenn du z. B. 1010110 steht.

Woher ich das weiß:Hobby

Meta bezeichnet ein sogenanntes Meta Tag. Also ein Abschnitt der Informationen für den Browser enthält sogenannte Meta-Informationen.

Charset ist die Encodierung der Zeichen. Bei Digitalen Protokollen ist ein Buchstabe ja auch einfach nur eine Zahl, der Browser muss jetzt wissen welche Zahl welchem Buchstaben zugeordnet ist damit er den korrekten Buchstaben anzeigt.

Bei UTF8 wird zB jedem Zeichen (ein Zeichen muss noch kein ganzer Buchstabe sein) 8 Bit zugeordnet also eine Zahl von 0 bis 255. Bei Ascii wird jedem Buchstaben (in diesem Fall auch jedem Zeichen) eine Zahl von 0-127 also 7 Bit zugeordnet. UTF8 ist ein Superset von Ascii also jedes File in Ascii Encoding kann auch in UTF8 gelesen werden, aber nicht jedes Zeichen von UTF8 kann in Ascii dargestellt werden. UTF8 ist zudem ein Multibytesystem sprich, das kleinste Zeichen in UTF8 sind 8 Bit das größte kann bis zu 4 Byte also 32 Bit lang sein. Das wird dadurch erreicht, dass das erste Byte auch neben dem eigentlichen Buchstaben anzeigen kann ob ein weiteres Byte folgt. Alle Zeichen in dieser Folge zeigen dann welche Buchstabe dargestellt werden soll.

Das Betrifft zB Umlaute. Ein Umlaut wie zB Ö wird in UTF8 kodierten Seiten normal angezeigt in Ascii kodierten Seiten kann das Zeichen nicht dargestellt werden.

Wichtig für die Angabe des Charsets ist aber, dass das HTML File auch in diesem oder einem Kompatiblen Charset erstellt wurde bzw eben in diesem Encoding vorliegt.

UTF-8 ist eine Zeichenkodierung. Eine Kodierung weist einem Zeichen, zum Beispiel "a", aber auch Umlauten wie "ü", oder sogar Emojis, einen bestimmten Wert zu, den der Computer versteht, und dann das entsprechende Zeichen anzeigen kann. Den Wert kann der Computer aber nur verstehen, wenn man ihm sagt, welche Zeichenkodierung verwendet wird (zum Beispiel UTF-8). Und das wird in HTML mittels des <meta charset="..."> Tags gemacht.

UTF-8 ist dabei eine Kodierung für Unicode-Zeichen. Unicode wiederum ist ein Standard, in welchem jedes erdenkliche Zeichen (lateinisches Alphabet, Umlaute, chinesisches und russisches Alphabet, Emojis, etc...) festgelegt werden soll.

Der Buchstabe Großes A hat zum Beispiel in Unicode den Wert U+0041.

Woher ich das weiß:Berufserfahrung – Inhaber einer App-Agentur & 15+ Jahre Programmiererfahrung

Da es viele verschiedene Schriftsysteme mit den verschiedensten Buchstaben/Zeichen gibt wurden diese in Zeichensätze zusammengefasst. Diese Zeichensätze haben aber unterschiedliche Zeichenkodierungen (charset).

Zum Beispiel sind in dem Zeichensatz für die deutsche Schrift Buchstaben wie äöüß vorhanden, welche in anderen Sprachen nicht genutzt werden.

Dieses Meta-Tag gibt an welche Zeichenkodierung für die Seite verwendet wird und zwar UTF-8.
https://de.wikipedia.org/wiki/UTF-8
Dies ist eine Zeichenkodierung, welches jeden/jedes Buchstaben/Zeichen unterstützt.