le type de contenu se refiere al contenido de un archivo que se transfiere mediante de HTTP y se clasifica según una estructura de dos partes. Esta clasificación está estandarizada y publicada por la IANA (Internet Assigned Numbers Authority, que supervisa la asignación global de direcciones IP). Una definición alternativo es MIME. En esta circunstancia, el contenido de los datos se especifica según el MIME (Multipurpose Internet Mail Extensions). El tipo de contenido es además una metaetiqueta de un documento HTML que puede mostrar a los navegadores qué contenido se está usando en esa página web específica.
Tipos de contenido MIME
Existe una gran variedad de tipos de contenido, que además se denominan tipos MIME. El estándar MIME se introdujo específicamente para los correos electrónicos.
La indicación del tipo de medio de Internet proporciona dos especificaciones y opcionalmente una adicional. El primero incluye el tipo de medio y el segundo la subcategoría. Se pueden usar los siguientes tipos de medios:
- Appli: Se trata de ficheros que pueden ser utilizados por una aplicación particular o ficheros para los que no es factible una asignación única.
- l'audio: Se refiere a los archivos de audio contenidos en un documento.
- Exemple: Si un documento está marcado con esto, contiene ejemplos de formatos de fichero específicos.
- Photo: Indica los archivos de imágenes y gráficos.
- message: Esto especifica mensajes como el email.
- Modèle: Designa datos con estructura multidimensional.
- Multiparte: Este tipo designa archivos que constan de varias partes.
- Texte: Este es el tipo de medio de Internet para archivos de texto.
- Vidéo: Se usa para archivos de vídeo.
Las combinaciones comunes con subcategorías son:[1]
- Imagen/jpeg: Archivo de imagen JPEG
- Imagen/tiff: Archivo de imagen TIFF
- Texto/plano: Archivo TXT (Texto Simple)
- Video/mpeg: Archivos MP2, MPA, MPE, MPEG, MPG
- Audio/mpeg: archivos MP3
- Audio/x-wav: archivos wav
Si se está clasificando un documento HTML, además se puede completar el juego de caracteres. Una factible especificación sería por ejemplo: text/html; charset=UTF-8
Tipo de contenido como meta etiqueta
El tipo de contenido meta tag se establece en el encabezado de una página web para mostrar el juego de caracteres estándar y el tipo de contenido que se está utilizando en una página HTML.
Bénéfices
Definiendo el tipo de contenido y, en particular, el charset (conjunto de caracteres), se puede garantizar que cualquier navegador pueda visualizar correctamente la página. Si esta especificación no se inserta en el encabezado de una página, es factible que los navegadores no puedan mostrar las diéresis ä, ö y ü o este tipo de caracteres correctamente. Anteriormente se veían muchas veces páginas en las que las diéresis se sustituían alternativamente por marcadores de posición variables.
La puntuación especial además puede causar problemas. Al especificar el tipo de contenido, el juego de caracteres que se utilizará se definirá de acuerdo con la regla ISO. Cuando un navegador acceda más tarde a la página, reconocerá a partir de esta especificación qué juego de caracteres debe utilizarse. Por ende se asegura la correcta interpretación de todos los caracteres.
Ejemplo de incorporación
La metaetiqueta Tipo de contenido tiene el siguiente aspecto:
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso-8859-1">
El juego de caracteres de Europa Occidental y América, ISO-8859-1, se aplica a las páginas en castellano.
Otros estándares ISO para webs en idiomas extranjeros
Si las webs se hacen público en otros idiomas, se aplican normas distintos:
ISO 8859-1: Albanés, danés, alemán, inglés, feroés, finlandés, francés, gallego, islandés, irlandés, italiano, catalán, holandés, noruego, portugués, español, sueco. ISO 8859-2: Croata, polaco, rumano, eslovaco, esloveno, checo, húngaro. ISO 8859-3: Esperanto, gallego, maltés, turco (Turco además ISO 8859-9.). ISO 8859-4: Estonio, letón, lituano. ISO 8859-5: Búlgaro, macedonio, ruso, serbio, ucraniano. ISO 8859-6: Árabe ISO 8859-7: Griego moderno. ISO 8859-8: Hebreow. ISO 8859-9: Turco. ISO 8859-10: groenlandés (inuit), sami (sami)
Pertinence pour le référencement
Por medio de la definición de meta tags se proporcionan información a los motores de búsqueda. Por ende, se recomienda usar metatags de tipo contenido. Esta especificación es una de las etiquetas que puede ser fácilmente leída por el motor de búsqueda de Google. Si se define esta etiqueta, Googlebot puede categorizar por adelantado el contenido crawleado con precisión. A la vez, se facilita la asignación a la búsqueda vertical, como la búsqueda de imágenes o vídeos.
El tipo de contenido además es esencial para la asignación de idiomas. Si se establece el juego de caracteres de Europa Occidental para un portal web alemám, Google descubre automáticamente que las diéresis ä, ö y ü deben equipararse con ae, oe y ue. Si un usuario busca, por ejemplo, «Linkpopularitaet» (en inglés: enlace popularity), entonces Google puede generar resultados de búsqueda que contengan la palabra «Linkpopularitaet».
Liens web