Codifica di caratteri

Una codifica di caratteri, o charset, consiste in un codice che associa un insieme di caratteri (tipicamente rappresentazioni di grafemi così come appaiono in un alfabeto utilizzato per comunicare in una lingua naturale) ad un insieme di altri oggetti, come numeri (specialmente nell'informatica) o pulsazioni elettriche, con lo scopo di facilitare la memorizzazione di un testo in un computer o la sua trasmissione attraverso una rete di telecomunicazioni. Esempi comuni sono il Codice Morse e la codifica ASCII.

A seconda del livello di astrazione e del contesto, i punti di codice corrispondenti e lo spazio di codice risultante possono essere considerati come modelli di bit, ottetti, numeri naturali, impulsi elettrici, ecc. Una codifica dei caratteri viene utilizzata nel calcolo, nell'archiviazione dei dati e nella trasmissione di dati testuali. "Set di caratteri", "mappa di caratteri", "set di codici" e "code page" sono termini correlati, ma non identici. ^[1]

I primi codici di caratteri associati al telegrafo ottico o elettrico potevano rappresentare solo un sottoinsieme dei caratteri usati nelle lingue scritte, a volte limitati a lettere maiuscole, numeri e solo alcuni segni di punteggiatura. Il basso costo della rappresentazione digitale dei dati nei moderni sistemi informatici consente codici di caratteri più elaborati (come Unicode) che rappresentano la maggior parte dei caratteri utilizzati in molte lingue scritte. La codifica dei caratteri utilizzando standard accettati a livello internazionale consente lo scambio di testo in formato elettronico a livello mondiale.

^ Character Encoding Definition, su techterms.com. URL consultato il 5 dicembre 2020.

[1] Character Encoding Definition, su techterms.com. URL consultato il 5 dicembre 2020.

[1]