Semi Join vs Bloom Join
Semi join og Bloom join er to sammenkoblingsmetoder, der bruges i forespørgsel til behandling af distribuerede databaser. Ved behandling af forespørgsler i distribuerede databaser skal data overføres mellem databaser placeret på forskellige steder. Dette kan være en kostbar operation afhængig af den mængde data, der skal overføres. Derfor, når du behandler forespørgsler i et distribueret databasemiljø, er det vigtigt at optimere forespørgslerne for at minimere mængden af data, der overføres mellem websteder. Halvforbindelse og blomstringsforbindelse er to metoder, der kan bruges til at reducere mængden af dataoverførsel og udføre effektiv forespørgselbehandling.
Hvad er Semi Join?
Semi join er en metode, der bruges til effektiv forespørgsel i en distribueret databasemiljø. Overvej en situation, hvor en medarbejderdatabase (der indeholder oplysninger såsom medarbejderens navn, afdelingens nummer, hun arbejder for osv.), Der findes på sted 1 og en afdelingsdatabase (med oplysninger om afdelingens navn, afdelingens navn, placering osv.) Placeret på stedet 2. Hvis vi f.eks. Ønsker at få medarbejdernavnet og afdelingsnavnet, som hun arbejder for (kun af afdelinger beliggende i “New York”), ved at udføre en forespørgsel på en forespørgselsprocessor, der findes på sted 3, er der flere måder at data kunne overføres mellem de tre steder for at opnå denne opgave. Men når du overfører data, er det vigtigt at bemærke, at det ikke er nødvendigt at overføre hele databasen mellem webstederne. Kun nogle af de attributter (eller tuples), der kræves til sammenføjningen, skal overføres mellem webstederne for at udføre forespørgslen effektivt. Semi join er en metode, der kan bruges til at reducere mængden af data, der sendes mellem webstederne. Ved semi-sammenkobling overføres kun sammenføjningskolonnen fra det ene sted til det andet, og derefter bruges den overførte kolonne til at reducere størrelsen på de afsendte forhold mellem de andre steder. For ovenstående eksempel kan du bare overføre afdelingens nummer og afdelingens navn på tuples med placering = ”New York” fra sted 2 til sted 1 og udføre sammenføjningen på sted 1 og overføre det endelige forhold tilbage til sted 3.
Hvad er Bloom Join?
Som nævnt tidligere er bloom join en anden metode, der bruges til at undgå at overføre unødvendige data mellem sider, når der udføres forespørgsler i et distribueret databasemiljø. I blomstringsforbindelse, snarere end at overføre selve sammenføjningskolonnen, overføres en kompakt repræsentation af sammenføjningskolonnen mellem webstederne. Bloom join bruger et blomsterfilter, der bruger en bitvektor til at udføre forespørgsler om medlemskab. For det første bygges et blomstringsfilter ved hjælp af sammenføjningskolonnen, og det overføres mellem stederne, og derefter udføres sammenføjningsoperationer.
Hvad er forskellen mellem Semi Join og Bloom Join?
Selvom både semi-join- og bloom-sammenkoblingsmetoder bruges til at minimere mængden af data, der overføres mellem webstederne, når der udføres forespørgsler i et distribueret databasemiljø, reducerer blomstringsforbindelse mængden af data (antal tupper), der overføres sammenlignet med semi-sammenføjning ved at bruge koncept med blomsterfiltre, der anvender en bitvektor til at bestemme sæt medlemskab. Derfor vil brug af blomsterforbindelse være mere effektiv end at bruge semi-sammenføjning.