Unicode vs ASCII
ASCII og Unicode er to tegnkodninger. Grundlæggende er de standarder for, hvordan man repræsenterer forskelligtegn i binært, så de kan skrives, gemmes, transmitteres og læses i digitale medier. Den største forskel mellem de to er i den måde, de koder for tegnet og antallet af bits, de bruger til hver. ASCII brugte oprindeligt syv bits til at kode for hvert tegn. Dette blev senere øget til otte med Extended ASCII for at tackle den tilsyneladende utilstrækkelighed af originalen. I modsætning hertil bruger Unicode et variabelt bitkodningsprogram, hvor du kan vælge mellem 32, 16 og 8-bit kodinger. Ved at bruge flere bits kan du bruge flere tegn på bekostning af større filer, mens færre bits giver dig et begrænset valg, men du sparer meget plads. Brug af færre bit (dvs. UTF-8 eller ASCII) ville sandsynligvis være bedst, hvis du koder et stort dokument på engelsk.
En af hovedårsagerne til, at Unicode var problemet, opstod fra de mange ikke-standard udvidede ASCII-programmer. Medmindre du bruger den udbredte side, som bruges af Microsoft og de fleste andre softwarevirksomheder, vil du sandsynligvis støde på problemer med dine tegn, der vises som felter. Unicode fjerner praktisk talt dette problem, da alle karakterkodepunkter blev standardiseret.
En anden stor fordel ved Unicode er, at det maksimalt kan rumme et stort antal tegn. På grund af dette indeholder Unicode i øjeblikket de fleste skriftlige sprog og har stadig plads til endnu mere. Dette inkluderer typiske venstre-til-højre-scripts som engelsk og endda højre-til-venstre-scripts som arabisk. Kinesisk, japansk og de mange andre varianter er også repræsenteret i Unicode. Så Unicode bliver ikke erstattet når som helst snart.
For at opretholde kompatibilitet med det ældre ASCII, som allerede var i udbredt brug på det tidspunkt, var Unicode designet på en sådan måde, at de første otte bit matchede den på den mest populære ASCII-side. Så hvis du åbner en ASCII-kodet fil med Unicode, får du stadig de korrekte tegn kodet i filen. Dette letter vedtagelsen af Unicode, da det mindskede virkningen af at vedtage en ny kodningsstandard for dem, der allerede brugte ASCII.
Resumé:
1.ASCII bruger en 8-bit-kodning, mens Unicode bruger en variabel bit-kodning.
2.Unicode er standardiseret, mens ASCII ikke er det.
3.Unicode repræsenterer de fleste skriftlige sprog i verden, mens ASCII ikke gør det.
4.ASCII har sit ækvivalent inden for Unicode.