Datamining mod datalagring
Processen med dataindvinding refererer til en gren af datalogi, der beskæftiger sig med udvinding af mønstre fra store datasæt. Disse sæt kombineres derefter ved hjælp af statistiske metoder og fra kunstig intelligens. Data mining i moderne forretning er ansvarlig for omdannelsen af rå data til kilder til kunstig intelligens. Dataene er manipuleret og er således i stand til at give pålidelige beslutninger, der kan bruges i beslutningsprocessen. Dette giver virksomheder en fordel i forhold til konkurrence, idet de har datasæt, som man kan stole på for at levere intelligens. Data mining anvendes også af organisationer til profilering, herunder marketing, overvågning af videnskabelig opdagelse og afsløring af svig.
Der er andre almindelige udtryk, der kan være forbundet med dataudvinding, såsom datafiskeri, datamududring eller endda datasnuffing. Alle disse peger mod forskellige variationer af data mining, der anvendes til udtagning af små datasæt, der kan være for små til at frembringe statistiske slutninger. Disse er dog afgørende for at skitsere gyldigheden af de anvendte data og kan bruges til at skabe en hypotese, når man ser frem til at nå en given datapopulation.
Et datavarehus er på den anden side et udtryk, der beskriver et system i en organisation, der bruges til indsamling af data. Disse data indsamlet af et datavarehus er det, der leveres af transaktionssystemerne såsom faktura, købsposter eller endda låneposter. Dataregistreringerne er hentet fra de individuelle oprettelsespunkter og samles under ét tag, dvs. datalageret. Disse data rapporteres derefter, og rapporteringen udføres på en samlet måde for at hjælpe brugere af forretningsinformationen med at tage gyldige beslutninger. Datavarehuset for at arbejde effektivt kræver datakilden, en database og et rapporteringsværktøj.
Det kan derfor siges, at et datavarehus er en database, der bruges til de specifikke formål med rapportering af data, der er analyseret. Disse data kommer fra de forskellige systemer, der er udarbejdet til rapportering.
For at udføre sin funktion opretholder datavarehuset funktioner i tre forskellige lag. Disse inkluderer iscenesættelse, integration og adgang. I iscenesættelsesprocessen gemmes rå data af udviklere med det eneste formål med analyse og support. Integrationslaget bruges til integration af data og til at få et abstraktionsniveau fra brugerne af dataene. Endelig er adgangslaget vigtigt for at få data ud af forskellige brugere af data.
Både data mining og data warehousing kan omtales som værktøjer, der bruges til indsamling af forretningsinformation. Hovedforskellen mellem de to er, hvordan forretningsinformationen indsamles. Det kan derfor siges, at data, der er oplagret, er ret nemme at udnytte og dermed gøre brug af. Datalageret er således ansvarlig for at gøre arbejdet med dataudvindingen lettere ved at huse alle relevante data, der skal udvindes på et centralt sted, snarere end når dataudvindingen skal fortsætte med at søge efter data forskellige steder. Dette hjælper med at spare på den tid, der bruges til data mining og de ressourcer, der bruges i mining.
Resumé
Data mining er processen med at udtrække data fra store datasæt.
Datalagring er processen med at samle alle relevante data sammen.
Både datamining og datalagring er værktøjer til indsamling af business intelligence.
Data mining er specifik i dataindsamling.
Datalagring er et værktøj til at spare tid og forbedre effektiviteten ved at samle data fra forskellige placeringer fra forskellige områder af organisationen.
Datavarehus har tre lag, nemlig iscenesættelse, integration og adgang.