Forskellen mellem RDBMS og Hadoop

Det vigtigste forskel mellem RDBMS og Hadoop er, at RDBMS gemmer strukturerede data, mens Hadoop gemmer strukturerede, semistrukturerede og ustrukturerede data.

RDBMS er et databasestyringssystem baseret på den relationelle model. Hadoop er en software til lagring af data og kørsel af applikationer på klynger med råvaremateriale.

INDHOLD

1. Oversigt og nøgleforskel
2. Hvad er RDBMS
3. Hvad er Hadoop
4. Sammenligning side ved side - RDBMS vs Hadoop i tabelform
5. Resume

Hvad er RDBMS?

RDBMS står for Relational Database Management System baseret på den relationelle model. I RDBMS bruges tabeller til at gemme data, og taster og indekser hjælper med at forbinde tabellerne. En tabel er en samling af dataelementer, og de er enhederne. Det indeholder rækker og kolonner. Rækkerne repræsenterer en enkelt post i tabellen. Kolonnerne repræsenterer attributterne.

For eksempel kan salgsdatabasen have kunde- og produktenheder. Kunden kan have attributter såsom customer_id, navn, adresse, phone_no. Elementet kan have attributter såsom product_id, navn osv. Den primære nøgle til kundetabel er customer_id, mens den primære nøgle til product table er product_id. At placere product_id i kundetabellen som en fremmed nøgle forbinder disse to enheder. Ligeledes er tabellerne også relateret til hinanden. De giver dataintegritet, normalisering og mange flere. Få af de fælles RDBMS er MySQL, MSSQL og Oracle. De bruger SQL til forespørgsel.

Hvad er Hadoop?

Hadoop er en Apache open source-ramme skrevet i Java. Det hjælper med at lagre og behandle en stor mængde data på tværs af klynger af computere ved hjælp af enkle programmeringsmodeller. Hovedmålet med Hadoop er at gemme og behandle Big Data, der henviser til en stor mængde komplekse data. Hadoop, som er kapaciteten til at behandle en datamængde inden for en bestemt periode, er stor.

Der er fire moduler i Hadoop-arkitektur. De er almindelige Hadoop, YARN, Hadoop Distribueret filsystem (HDFS) og Hadoop MapReduce. Det fælles modul indeholder Java-biblioteker og værktøjer. Det har også filerne til at starte Hadoop. Hadoop YARN udfører jobplanlægning og styring af klyngeressourcer.

Desuden er Hadoop Distribueret filsystem (HDFS) Hadoop-lagringssystemet. Det bruger master-slave-arkitekturen. Master-noden er NameNode, og den administrerer metafildataene for filsystemet. Andre computere er slaveknudepunkter eller DataNoder. De gemmer de faktiske data. På den anden side udfører Hadoop MapReduce den distribuerede beregning. Det har algoritmerne til at behandle dataene. I HDFS har master-noden en job tracker. Det kører kort reducere job på slaveknudepunkter. Der er en Task Tracker for hver slaveknude til at afslutte databehandlingen og for at sende resultatet tilbage til masternoden. Alt i alt giver Hadoop massiv lagring af data med en høj behandlingskraft.

Hvad er forskellen mellem RDBMS og Hadoop?

RDBMS vs Hadoop

RDBMS er en systemsoftware til at oprette og administrere databaser, der er baseret på den relationelle model. Hadoop er en samling af open source-software, der forbinder mange computere til at løse problemer, der involverer en stor mængde data og beregning.
 Datasortiment
RDBMS gemmer strukturerede data. Hadoop gemmer strukturerede, semistrukturerede og ustrukturerede data.
Data opbevaring
RDBMS gemmer den gennemsnitlige mængde data. Hadoop gemmer en stor mængde data end RDBMS.
 Hastighed
I RDBMS er læsninger hurtig. I Hadoop er læser og skriver hurtigt.
Skalerbarhed
RDBMS har lodret skalerbarhed. Hadoop har vandret skalerbarhed.
Hardware
RDBMS bruger avancerede servere. Hadoop bruger råvarehardware.
  gennemløb
RDBMS-gennemstrømning er højere. Hadoop gennemstrømning er lavere.

Resume - RDBMS vs Hadoop

Denne artikel diskuterede forskellen mellem RDBMS og Hadoop. Den vigtigste forskel mellem RDBMS og Hadoop er, at RDBMS gemmer strukturerede data, mens Hadoop gemmer strukturerede, semistrukturerede og ustrukturerede data.

Reference:

1.Tutorials Point. “SQL RDBMS-koncepter.” , Tutorials Point, 8. januar 2018. Tilgængelig her  
2.Tutorials Point. “Hadoop-tutorial.” , Tutorials Point, 8. januar 2018. Tilgængelig her  

Billede høflighed:

1.'8552968000'by Intel Free Press (CC BY-SA 2.0) via Flickr