Codificação de caracteres

CODIFICAÇÃO DE CARACTERES



Uma codificação de caracteres é um padrão de relacionamento entre um conjunto de caracteres com um conjunto de outra coisa, como por exemplo pulsos elétricos ou números que viam facilitar o armazenamento de texto em computadores e sua transmissão através de redes de telecomunicação. Exemplos comuns são o código Morse que codifica as letras do alfabeto latino e os numerais como sequências de pulsos elétricos de longa e curta duração e também o ASCII que codifica os mesmos grafemas do código Morse além de outros símbolos através de números inteiros e da representação binária em sete bits destes mesmos números.





TABELA DE CÓDIGO ASCII

ASCII- American Standart Code for Information Interchange / Código Padrão Americano para o Intercâmbio de Informação, é um código binário que codifica um conjunto de 128 sinais - 95 dos quais são gráficos (letras do alfabeto latino, sinais de pontuação e sinais matemáticos) e 33 de controle, utilizando 7 bits para representação.
A codificação ASCII é utilizada para representar textos em equipamentos de comunicação, computadores e outros dispositivos que trabalham com este tipo de média. Foi desenvolvida em 1960 e a partir daí grande parte das codificações de caracteres modernos herdaram essa base.
Os sinais não-imprimíveis ou sinais de controle, são bastante utilizados nos dispositivos de comunicação e interagem com todo o processamento do texto. 
O código ASCII é maioritariamente utilizado para a conversão de Código Binário para Letras do alfabeto - maiúsculas ou minúsculas.







CÓDIGO UNICODE

UNICODE é um padrão que dá acesso aos computadores representarem e manipularem, de uma forma sólida, um texto de um qualquer sistema de escrita existente. O padrão consiste em mais de 107 mil caracteres, um conjunto de diagramas de códigos para referência visual, uma metodologia para codificação e um conjunto de codificações padrões de caracteres, uma enumeração de propriedades de caracteres como caixa alta e baixa, regras para normalização, decomposição, ordenação alfabética e renderização.
Atualmente, este padrão é trabalhado pela Unicode Consortium - uma organização sem fins lucrativos, que tem como objetivo substituir esquemas de codificação de caracteres por esquemas padronizados de transformação Unicode. Este trabalho é realizado em conjunto com a Organização Internacional para Padronização e compartilha todo o tipo de caracteres. Ambos codificam caracteres, mas o padrão Unicode transmite muito mais informação para implementadores, cobrindo áreas como ordenação alfabética e visualização.




Referências:
https://www.w3.org/International/questions/qa-choosing-encodings.pt-br
https://pt.wikipedia.org/wiki/Codifica%C3%A7%C3%A3o_de_caracteres

Comentários

Mensagens populares