XML vs HTML
XML står for EXtensible Markup Language. Det er defineret i XML 1.0-specifikationen, som er udviklet af W3C (World Wide Web Consortium). XML giver en standard måde, som også er enkel, til at kode data og tekst, så indholdet kunne udveksles på tværs af driverhardware, operativsystemer og applikationer med lidt menneskelig indgriben. HyperText Markup Language, bredt kendt som HTML, er også et førende markup-sprog for websider. HTML er den grundlæggende byggesten til websider. Webbrowser læser HTML-dokumentet og komponerer dem til visuelle eller hørbare websider.
XML
XML er et markup-sprog, der bruges til at overføre data og tekst mellem driverhardware, operativsystemer og applikationer med lidt menneskelig indgriben. XML leverer tags, attributter og elementstrukturer, der kan bruges til at give kontekstoplysninger. Denne kontekstinformation kan bruges til at afkode betydningen af indholdet. Dette gør det muligt at udvikle effektive søgemaskiner og udføre data mining på dataene. Yderligere er traditionelle relationelle databaser egnede som XML-data, fordi de kunne organiseres i rækker og kolonner, men XML giver mindre støtte til data med rig indhold som lyd, video, komplekse dokumenter osv. XML-databaser lagrer data i en struktureret, hierarkisk form som gør det muligt at behandle forespørgsler mere effektivt. XML-tags er ikke foruddefineret, og brugerne kan definere nye tags og dokumentstrukturer. Der blev også oprettet nye internetsprog som RSS, Atom, SOAP og XHTM vha. XML.
HTML
HTML som nævnt tidligere er et markup-sprog, der har et sæt markeringskoder. HTML-markup-tags, som normalt kaldes HTML-tags, bruges til at beskrive websider. Typiske HTML-dokumenter indeholder HTML-tags såvel som almindelig tekst, der kræves til indholdet af websider. HTML-tags kunne let identificeres i et HTML-dokument, da de er omgivet af vinkelbeslag (f.eks.). HTML-tags indsættes typisk i et dokument parvis, hvor det første tag er startmærket (f.eks. ) og det andet tag er slutmærket (f.eks. ). En webbrowser (f.eks. Internet Explorer, Firefox osv.) Har til opgave at læse et HTML-dokument og vise det som en webside. Browseren bruger HTML-tags til at tolke sideindholdet, men selve HTML-tags vises ikke af browseren. HTML-sider kan integrere billeder, objekter og scripts skrevet på sprog som JavaScript. Endvidere kan HTML bruges til at oprette interaktive former.
Forskel mellem XML og HTML
Selvom XML og HTML begge er markeringssprog, er der nogle grundlæggende forskelle mellem dem. HTML består hovedsageligt af tags, der definerer indholdets udseende, mens XML-tags generelt definerer strukturen og indholdet af data (og det faktiske udseende defineres af et tilknyttet stilark). For det andet er XML udvidelig, da XML-tags kan defineres af brugeren til et specifikt program, mens HTML-tags er defineret af W3C.