ISO 15924

La norma ISO 15924 enumera "Códigos para la representación de nombres de secuencias de comandos  ". El Consorcio Unicode gestiona la oficina de la autoridad de registro y mantenimiento de la norma en nombre de ISO, que define y aprueba la norma. Sin embargo, el estándar ISO 15924 no es parte del estándar Unicode (que usa scripts unificados que se enfocan solo en distinciones de caracteres abstractos).

Designación y organización de sistemas de escritura según ISO 15924

El estándar define para cada sistema de escritura:

Para obtener una lista completa (y actualizada) de códigos y nombres definidos, simplemente consulte el sitio web indicado al final del artículo.

Nomenclatura y clasificación numérica

Los elementos de código digital se agrupan en series de alrededor de un centenar según la tipología y la proximidad relativa de los sistemas de escritura (ver ejemplos a continuación).

Los elementos de código y los nombres se definen para tener en cuenta también las necesidades bibliográficas relativas a textos y documentos completos, y no se reservan solo para caracteres aislados. Además, los diferentes estilos de escritura que utilizan el mismo alfabeto abstracto tienen elementos específicos, clasificados con elementos cercanos a la misma serie, si es posible consecutivos. Para ello, los elementos de código digital no se asignan simplemente en incrementos de 1 (hay "huecos" en la numeración).

Actualmente se utilizan las siguientes series:

Composición y asignación de elementos de código alfabético.

Los elementos del código alfabético de cuatro letras utilizan el alfabeto latino básico de 26 letras. El caso de estos elementos de código no es significativo, pero el caso recomendado utiliza una letra mayúscula seguida de tres letras minúsculas. Estos elementos de código alfabético están inspirados en los nombres de las escrituras por razones mnemotécnicas. Sin embargo, los estilos variantes del mismo guión difieren, en la medida de lo posible, solo por su cuarta letra. Estas variantes también son reconocibles por sus elementos de código digital cercanos en la misma serie. Por ejemplo :

O :

Y también :

Sin embargo, dos elementos de código alfabético que comienzan con las mismas tres primeras letras no necesariamente designan dos variantes del mismo sistema de escritura (que posiblemente se puedan ver gracias a la clasificación numérica en series separadas):

Codetos especiales

Si los escritos estandarizados no son suficientes, hay 50 elementos de código que pueden usarse a discreción de los usuarios (los nombres usados ​​no son normativos y pueden modificarse):

Hay elementos de código especiales destinados a casos de lenguajes no escritos (por ejemplo, para el uso de clasificar fotografías y grabaciones de video o audio en las colecciones de bibliotecas de medios y museos), o cuando una escritura no se puede determinar de manera confiable debido a múltiples ( en familias distintas y para las que el conjunto no tiene un código predefinido más preciso), o incluso cuando la escritura no se ha especificado pero posiblemente podría indicarse con mayor precisión con otro código:

Histórico

Esta lista de elementos de código y nombres de scripts fue creada y es mantenida por Michael Everson , también miembro del Comité Técnico Unicode (UTC). El texto de ISO 15924 fue aprobado por primera vez el9 de enero de 2004, que estableció los principios generales para la definición de puntos de código.

La primera lista de elementos de código, muy completa en ese momento, fue publicada el 1 st de mayo de de 2004en línea en el sitio web del Consorcio Unicode . Incluía, entre otras cosas, todos los scripts utilizados o definidos en ese momento en el estándar Unicode 4.0 y el estándar ISO / IEC 10646. En las siguientes semanas siguió un número significativo de correcciones, y la lista se finalizó el29 de mayo de 2004.

Desde entonces, se han agregado regularmente algunos scripts nuevos para las necesidades de los scripts en el curso de la estandarización en ISO / IEC 10646 y Unicode, o para usos bibliográficos, así como para los scripts aún no estandarizados que aún no han sido objeto de ' estudios.

Relación con otras normas y recomendaciones

Relación con los elementos del código de idioma ISO 639

Además, los elementos del código alfabético ISO 15924 comienzan, en la medida de lo posible, con las mismas letras que los elementos del código de idioma de tres letras de acuerdo con ISO 639-2 o su extensión ISO 639-3 (que cubre una lista ampliada de idiomas). , cuando los nombres del guión y el idioma son homónimos. Por ejemplo :

La futura norma ISO 639-6 en preparación, que debería extender los elementos del código de idioma a cuatro letras (con el fin de identificar un mayor número de variantes de idioma) retoma este principio, y si es posible utiliza los mismos elementos de código ya retenidos en ISO 15924 . para scripts de idiomas homónimos, con el fin de mantener la compatibilidad con el  estándar actual RFC 5646 (BCP 47):

Código de idioma IETF

ISO 15924 es utilizado por el estándar de código de idioma IETF .

Configuracion regional

ISO 15924 se utiliza a veces para la configuración regional .

Diferencias en los nombres de los de ISO / IEC 10646

No existe una biyección exacta entre los nombres de escritura en inglés y francés definidos en ISO 15924 y las designaciones en inglés y francés utilizadas en los nombres normativos de caracteres y bloques de caracteres asignados en las normas ISO / IEC 10646 (y, por lo tanto, también Unicode ).

Sin embargo, los futuros bloques de caracteres y caracteres estandarizados en ISO / IEC 10646 (y por lo tanto también Unicode) serán nombrados, si es posible, de acuerdo con ISO 15924.

Diferencias entre los elementos del código alfabético y los del estándar Unicode

Asimismo, no existe una biyección exacta entre los elementos del código alfabético estandarizados en ISO 15924 y los códigos de secuencia de comandos utilizados en las tablas de propiedades de los caracteres Unicode . De hecho, el estándar ISO 15924 contiene elementos adicionales que proporcionan distinciones para el uso bibliográfico entre scripts que se han unificado en los estándares de codificación de caracteres ISO y Unicode. El estándar ISO 15924 contiene elementos de código y nombres distinguidos para scripts que, por lo tanto, se han unificado en uno en Unicode (que los trata como variantes tipográficas sin diferencia en la codificación de caracteres y sus propiedades normativas o informativas).

Por otro lado, dado que el estándar ISO 15924 se creó después del estándar Unicode, el formato de los elementos del código alfabético ISO 15924 puede diferir de los códigos normativos utilizados en las tablas de propiedades Unicode (que pueden ser más largos y contener guiones bajos).

Solo con fines informativos, el estándar ISO 15924 define un alias (o "sinónimo de valor de propiedad") para los scripts estándar, con el fin de conocer la correspondencia con las propiedades de los caracteres definidas en el estándar Unicode, cuando existe tal diferencia. Desde la publicación de la norma ISO 15924, el Consorcio Unicode se ha comprometido a no definir nuevos códigos distintos a los definidos en ISO 15924 y, por lo tanto, utiliza, siempre que sea posible, los elementos del código alfabético de la norma ISO 15924. Por eso no todos los sinónimos para las propiedades de Unicode se mencionan en las tablas ISO 15924 (los códigos utilizados se pueden encontrar en los archivos de propiedades del propio estándar Unicode, y Unicode ha agregado sinónimos para los valores de propiedad de caracteres, lo que ahora permite que solo se usen puntos de código ISO 15924 en conformidad con Unicode aplicaciones).

Ver también

enlaces externos

Artículos relacionados

  1. (en) Petición de observaciones n o  5646 .