segunda-feira, 27 de outubro de 2014

TEXTO - Padrões de Codificação de Caracteres: Código ASCII e Código Unicode

Padrões de Codificação de Caracteres


Uma codificação de caracteres é um padrão de relacionamento entre um conjunto de caracteres (representações de grafemas ou unidades similares a grafemas como as que compõem um alfabeto ou silabário utilizados na comunicação através de uma linguagem natural) com um conjunto de outra coisa, como por exemplo números ou pulsos eléctricos com o objectivo de facilitar o armazenamento de texto em computadores e sua transmissão através de redes de telecomunicação. Exemplos comuns são o código Morse que codifica as letras do alfabeto latino e os numerais como sequências de pulsos eléctricos de longa e curta duração e também o ASCII que codifica os mesmos grafemas do código Morse além de outros símbolos através de números inteiros e da representação binária em sete bits destes mesmos números.



ASCII

ASCII (American Standard Code for Information Interchange) designa uma tabela de código desenvolvida nos Estados Unidos da América na década de 60, dada a necessidade de criar um padrão que pudesse ser utilizado por todos os computadores, facilitando assim a comunicação entre eles e a troca de dados que esta implica.
A tabela ASCII utiliza conjuntos de 7 bits para representar 128 caracteres, muito deles adequados apenas à língua inglesa.
Apesar de ter sido uma enorme inovação e de  grande parte das codificações de caracteres atuais se terem desenvolvido a partir dele, este padrão de codificação apresenta grandes fragilidades ao mudar de linguagem como por exemplo na utilização do alfabeto árabe e consegue suportar apenas um número limitado de caracteres, 256.



Unicode

Unicode é um padrão que permite aos computadores representar e manipular, de forma consistente, texto de qualquer sistema de escrita existente. Publicado no livro The Unicode Standard1 ,2 o padrão consiste de pouco mais de 107 mil caracteres3 , um conjunto de diagramas de códigos para referência visual, uma metodologia para codificação e um conjunto de codificações padrões de caracteres, uma enumeração de propriedades de caracteres como caixa alta e caixa baixa, um conjunto de arquivos de computador com dados de referência, além de regras para normalização, decomposição, ordenação alfabética e renderização.


Fontes

Sem comentários:

Enviar um comentário