viernes, 16 de febrero de 2018

HTML: Juego de caracteres


¿Qué juego de caracteres debo usar?

El más recomendado es UTF-8 sin BOM. Si no se puede utilizar este por alguna razón, se puede emplear ISO-8859-1, también llamado Latin1. Pero si se necesita escribir el símbolo del euro (€), entonces se debe utilizar ISO-8859-15, también llamado Latin9. Latin1 y Latin9 se diferencian únicamente en 8 caracteres que han cambiado, y el único realmente importante para el español es la sustitución de un carácter por el símbolo €.

¿Cómo se indica el juego de caracteres en HTML?

Se realiza mediante una etiqueta <meta>, que se escribe en el <head> de la página web. En HTML5 se indica así:

<meta charset="utf-8"> o <meta charset="utf-8"/>

¿Qué es el BOM?

BOM es el acrónimo de Byte Order Mark, la Marca de Orden de Bytes, y es un carácter Unicode que se utiliza para indicar el orden de los bytes de un fichero de texto al principio del fichero.

En UTF-8, el BOM ocupa 3 bytes y tiene como representación hexadecimal EF BB BF, y como carácter aparece representado ï » ¿