UTF 7 contro UTF 8
UTF-7 e UTF-8 sono entrambi tipi di Unicode Transformation Format, lo standard utilizzato per codificare caratteri Unicode a 16 bit come lettere internazionali e simboli speciali in un formato che può essere trasmesso attraverso sistemi a 7 o 8 bit. UTF-8 è il formato di codifica più comunemente usato, diffuso nelle pagine Web e in molti programmi di posta elettronica. UTF-7 fornisce la codifica per alcuni protocolli di posta elettronica che non funzionano con UTF-8.
Unicode
Unicode è uno standard internazionale per rappresentare i caratteri come numeri interi. Utilizza 16 bit per carattere contro i sette bit utilizzati da ASCII, il codice standard americano per lo scambio di informazioni. ASCII può riprodurre solo 128 caratteri contro i 65.000 caratteri univoci disponibili in Unicode. Questa gamma più ampia di caratteri rende Unicode più appropriato per le lingue dell'Asia orientale e altre con set di caratteri di grandi dimensioni, ma i caratteri Unicode devono essere codificati se devono essere trasmessi tramite canali a 7 o 8 bit.
UTF-8
UTF-8 è il formato di trasformazione universale più comune utilizzato per convertire i caratteri Unicode in segmenti a 8 bit per la trasmissione sul Web tramite e-mail o altri canali a 8 bit. Questo formato di codifica modifica ogni carattere Unicode in da uno a quattro ottetti, a seconda del valore intero del carattere Unicode, ed è molto efficiente per i documenti che utilizzano principalmente lettere che si trovano anche nel set di caratteri ASCII. UTF-8 tende a occupare più spazio rispetto alla codifica a byte singolo per gli alfabeti non occidentali.
UTF-7
UTF-7 è una variante speciale dell'Universal Transformation Format proposto per la prima volta a metà degli anni '90. È stato progettato per rappresentare il testo Unicode con una stringa di caratteri ASCII, producendo un metodo di codifica per e-mail più efficiente rispetto a UTF-8, oltre alla codifica stampabile tra virgolette necessaria per trasmettere su un percorso dati a 7 bit. L'uso della codifica UTF-7 riduce notevolmente la dimensione dei caratteri codificati.
Considerazioni
Sebbene UTF-7 sia più efficiente sui canali a 7 bit rispetto a UTF-8 più stampabile quotato, la maggior parte delle autorità, inclusi Internet Mail Consortium e Microsoft Developer Network, consiglia di utilizzare UTF-8 su UTF-7 quando possibile. Questo perché UTF-7 crea problemi di sicurezza e robustezza non presenti nel suo parente a 8 bit. L'IMC raccomanda inoltre che tutti i programmi di visualizzazione della posta creati dopo il 1 gennaio 1999 siano in grado di visualizzare la posta in UTF-8.