ANSI vs Unicode
ANSI og Unicode er to karakterkodninger, der på et eller andet tidspunkt var i udbredt brug. Brug er også den største forskel mellem de to, da ANSI er meget gammel og bruges af operativsystemer som Windows 95/98 og ældre, mens Unicode er en nyere kodning, der bruges af alle de nuværende operativsystemer i dag. ANSI havde mange begrænsninger, der ikke umiddelbart blev synlige i de tidlige stadier af brugen, men blev smerteligt klare, når computeren begyndte at sprede sig globalt.
Den største ulempe ved ANSI er brugen af mange kodesider afhængigt af det sprog, der bruges. der er en for engelsk (kendt som vesteuropæisk latin), græsk, tyrkisk, hebraisk, arabisk og mange andre. Der er ikke noget problem, når alle computere, der får adgang til dataene, bruger den samme kodeside, men når forskellige kodesider er i brug, vil de læste data ikke være de samme som de skrevne data. Dette kan resultere i datakorruption og endda programnedbrud i visse scenarier.
Årsagen til, at ANSI ikke kan rumme, er at den kun bruger 8 bit til at repræsentere hvert kodepunkt. Denne bredde er fast og har kun i alt 256 forskellige kombinationer. Til sammenligning bruger Unicode maksimalt 32 bit til hvert kodepunkt; bruges i fast bredde i UTF-32. Men fordi der bruges fire bytes til hver karakter er et så stort spild af plads, bruges kodning med variabel bredde i UTF-8 og UTF-16 for at spare plads.
Da Unicode er en nyere standard, forventes det, at ældre operativsystemer muligvis ikke understøtter den. Selvom kodepunkterne for UTF-8 og ANSI er stort set identiske, kan ældre operativsystemer som Windows 95 ikke fungere med det. Derfor vil programmer, der bruger Unicode, ikke kunne køre korrekt på disse operativsystemer. Med hensyn til det modsatte eller kørsel af ANSI-kodede programmer på nyere operativsystemer er det muligt, da der er mekanismer til at konvertere mellem ANSI og Unicode. Bare husk, at konverteringen tilføjer en smule behandlingsomkostninger. Det er måske ikke vigtigt i betragtning af nutidens computere, men det er stadig værd at bemærke at forbedre programeffektiviteten.
Resumé:
1. ANSI er en meget gammel karakterkodning, og Unicode er den aktuelle standard, der bruges i dag
2. ANSI bruger forskellige sider til forskellige sprog, mens Unicode ikke gør det
3. ANSI bruger kodning med fast bredde, mens Unicode kan bruge både fast og variabel bredde
4. Unicode-programmer fungerer ikke på ældre systemer
5. ANSI-programmer er langsommere end Unicode-programmer på aktuelle computere