Voorbeelden van Data Warehouse en zijn computerdefinitie

Wat als organisaties al hun data zouden verwerken in decision support? Wat zou er gebeuren als ze gespecialiseerde software zouden gebruiken die diende voor de presentatie van de informatie en de analyse ervan? We zullen wat geven Voorbeelden van datawarehouse om deze vragen te beantwoorden.

VOORBEELDEN-VAN-DATA-MAGAZIJN

Voorbeelden van datawarehouses

In de eerste plaats is het belangrijk om onderscheid te maken tussen twee termen die ons vanwege hun afkorting gemakkelijk in verwarring kunnen brengen, en vanaf het begin is het de bedoeling dat de gebruiker weet wat hij kan verwachten en enkele basisconcepten kent die hij gaat gebruiken. onder ogen zien. Hier zullen we oneindig veel voorbeelden laten zien die dienen zodat het individu de tools heeft om deze elementen te onderscheiden.

Definitie

Gezien het verschil tussen de twee termen, zullen we ze formeel definiëren, aangezien het een proces is dat de gegevens van een organisatie, zowel intern als extern, extraheert, transformeert, consolideert en integreert om ze toegankelijk en bruikbaar te maken bij het nemen van beslissingen. -maken.

Op dezelfde manier kan het datawarehouse ook worden gedefinieerd als een basis met elektronische bestandssysteeminformatie, waarin de benodigde gegevens worden opgeslagen voor informatie-analyse en besluitvorming. Het verschil is dat het bedrijfsgericht, geïntegreerd, tijdsafhankelijk en niet-vluchtig is.

Kortom, Data Warehousing (DWH) is een proces en Data Warehouse (DW) is een database.

Kenmerken

Er zijn verschillende aspecten die het datawarehouse kenmerken die de nodige tools bieden voor een optimaal gebruik, en dus voldoen aan geprogrammeerde richtlijnen die de tools voor het gebruik ervan op de best mogelijke manier genereren. We zullen de kenmerken van een datawarehouse in detail beschrijven:

Zakelijk georiënteerd

Alleen relevante gegevens worden ingevoerd in het Data Warehouse voor analyse en besluitvorming. Dat wil zeggen, gegevens die geen analytische waarde hebben, zoals kameradressen, postcodes, e-mailadressen, worden niet in aanmerking genomen. Maar ze zijn van wisselend belang, zoals type klant, geografische locatie, leeftijd, enz.

Entiteiten op hoog niveau worden beheerd, zoals klanten, producten, artikelen, gebieden en andere. De gegevens worden op een multidimensionale manier opgeslagen, dat wil zeggen in feite en dimensietabellen.

geïntegreerde

Alle gegevens uit heterogene bronnen worden geconsolideerd om de kwaliteit en netheid te garanderen. De belangrijkste gegevensbronnen zijn:

Volgens het type gebruiker.

    • Operationeel: Dagelijks levert het grote hoeveelheden data op, maar die zijn op zich van weinig belang voor de benodigde analyse. Bijvoorbeeld de verkoop van producten.
    • Medium: Genereert data met implicaties op korte en middellange termijn, op basis van operationele data. Een goed voorbeeld van dit concept is het genereren van voorraad.
    • Managerial: Gebruikt gegevens die voortkomen uit het integratie- en transformatieproces. Op zijn beurt genereert het nieuwe informatie. Het verwijst in feite naar de gebruiker van het datawarehouse.

Volgens het gebied of de afdeling van de organisatie

    • Gebieden: Elk heeft duidelijk omschreven verantwoordelijkheden. Ze produceren hun eigen gegevens die worden gedeeld met de andere gebieden.
    • Onderverdelingen: Ze zijn meestal geografisch. Ze leveren locatiegegevens, die samen met de anderen moeten worden opgenomen.

Volgens de bron

    • Intern: Ze genereren hun eigen gegevens, afkomstig uit de dagelijkse activiteiten van het bedrijf.
    • Extern: ze vullen interne gegevens aan, bijvoorbeeld tellingen en statistieken.

Variant in de tijd

Het biedt toegang tot verschillende versies van dezelfde situatie, aangezien actuele gegevens samen met historische gegevens worden opgeslagen in de datawarehouse-voorbeelden.

datawarehouse

Niet vluchtig

Het garandeert de stabiliteit van de informatie, want zodra de gegevens binnenkomen, veranderen ze niet. Dat wil zeggen dat de gegevens alleen worden gemanipuleerd wanneer ze worden ingevoerd en geraadpleegd.

Samengevat zijn de belangrijkste kwaliteiten van het Data Warehouse:

Kwaliteiten

Verwerkt data in volume, een gevolg van de opeenstapeling van historische, actuele en geaggregeerde data uit verschillende bronnen.

Het plaatst het volledige gegevensvolume in een enkele gecentraliseerde database. Structureer de gegevens op een multidimensionale manier.

voordelen

Door zijn kenmerken en kwaliteiten biedt het Data Warehouse de volgende voordelen:

  • Het vermindert de minimale tijd die nodig is om alle relevante gegevens over een specifiek onderwerp te verzamelen.
  • Biedt analysetools.
  • Veel rapporten en analyses zijn door de gebruiker gedefinieerd.
  • Het maakt het mogelijk om direct toegang te krijgen tot de indicatoren van de organisatie, deze te analyseren en te monitoren.
  • Het helpt bij het identificeren van de factoren die van invloed zijn op de werking van het bedrijf.
  • Het maakt het mogelijk om het toekomstige gedrag van de instelling te bevorderen en te bepalen.
  • Gebruikers kunnen snel en eenvoudig gegevens opvragen.

Kortom, het Data Warehouse helpt de organisatie bij het beantwoorden van essentiële vragen voor besluitvorming. Hierdoor worden concurrentievoordelen behaald die hun positie optimaliseren in de markt waarin zij opereren. Enkele van deze vragen zijn:

  • Wat is het profiel van de klanten?
  • Hoe is hun gedrag?
  • Wat is de winstgevendheid van het bedrijf?
  • Wat is het risico voor de organisatie?
  • Welke diensten en producten gebruikt u en hoe kunt u deze vergroten?

VOORBEELDEN-VAN-DATA-MAGAZIJN

Toepassingsgebied

Een Data Warehouse kan worden aangepast aan elke organisatie, ongeacht de omvang en complexiteit. Dit is een gevolg van de agenda van een instelling, bedrijf of organisatie bij het nemen van relevante beslissingen met betrekking tot de gegevens die het produceert.

Toepassingsrisico's

Het vraagt ​​een grote investering van de organisatie. De voordelen van de implementatie ervan worden niet gezien op de korte termijn, maar op de middellange en lange termijn.

De manipulatie van gegevens bedreigt de manipulatie van gevoelige gegevens.

Aspecten om rekening mee te houden

Zoals in het begin vermeld, zijn er verschillende aspecten waarmee rekening moet worden gehouden bij de toepassing van deze elementen voor het gebruik van een server. Onder hen kunnen we het volgende noemen:

Aanvraag kosten

Een datawarehouse brengt bouw-, exploitatie- en ondersteuningskosten met zich mee. De constructiekosten omvatten de kosten van menselijke hulpbronnen, tijd en technologie, terwijl die van gebruik en onderhoud rekening houden met de kosten van evolutie, groei en die veroorzaakt door veranderingen in de oorsprong van de gegevens.

Impact op mensen

De toepassing van een Data Warehouse wekt altijd verwachtingen bij gebruikers, die zich noodzakelijkerwijs nieuwe vaardigheden zullen moeten eigen maken. Het succes van dit soort data hangt af van actief gebruik en feedback van gebruikers.

Impact op bedrijfs- en besluitvormingsprocessen

Met de toepassing van een Data Warehouse kunnen bepaalde tekortkomingen in bedrijfsprocessen aan het licht komen, maar tegelijkertijd neemt het vertrouwen in de beslissingen die worden genomen op basis van de resultaten die ermee worden behaald, toe.

Architectuur

VOORBEELDEN-VAN-DATA-MAGAZIJN

De algemene architectuur van een voorbeelddatawarehouse wordt weergegeven in de bovenstaande afbeelding. Zoals te zien is, omvat dit systeem een ​​reeks interacties tussen zijn componenten. In dit verband en samengevat kan de werking ervan als volgt worden beschreven:

  • De gegevens zijn afkomstig uit verschillende bronnen, zoals webservices, bestanden en andere databases, zowel intern als extern.
  • Zodra de gegevens zijn geëxtraheerd, worden ze geïntegreerd, getransformeerd en opgeschoond om later in het datawarehouse te worden geladen.
  • Om tactische en strategische informatie te genereren, worden rapporten en analyses verkregen uit het laden van de gegevens.
  • Ten slotte kunnen gebruikers de gegenereerde rapporten en analyses raadplegen en verkennen.

elementen

We gaan nu enkele van de elementen beschrijven die in het datawarehouse kunnen worden geëvalueerd en waarmee rekening moet worden gehouden.

Datawarehouse-bronnen

Over het algemeen zijn ze het resultaat van de dagelijkse activiteiten van het bedrijf, in welk geval ze interne bronnen worden genoemd. Wanneer gegevens afkomstig zijn van bijvoorbeeld webservers, worden deze als externe bronnen beschouwd. Ze verschillen van elkaar, omdat ze afhankelijk zijn van hun oorsprong, formaat, functie, enz.

Extractie, transformatie en laden

VOORBEELDEN-VAN-DATA-MAGAZIJN

Dit proces, ook wel ETL genoemd, omvat alle taken die worden uitgevoerd vanaf het moment dat de gegevens worden verkregen totdat deze in het datawarehouse worden geladen. Dit zijn: extractie, manipulatie, controle, integratie, gegevensopschoning, laden en bijwerken.

extractie

Het omvat technieken die gericht zijn op het verkrijgen, uit verschillende bronnen, van alleen de relevante gegevens en deze in interne opslag te bewaren. Met dit type opslag kunnen gegevens worden gemanipuleerd zonder tussenkomst van of wijziging van de bronnen of het datawarehouse met meer gegevens, waardoor een extractielaag ontstaat tussen lezen en laden, opslaan en beheren van de metadata die in het proces wordt gegenereerd en integratie wordt vergemakkelijkt.

De extractie is gebaseerd op de behoeften van de gebruikers en de eisen die aan de oplossing worden gesteld.

Transformatie

Dit zijn de technieken die verantwoordelijk zijn voor het compatibel maken van de verschillende formaten, het filteren en classificeren van de gegevens en het relateren van bronnen.

Deze functie is verantwoordelijk voor het toepassen van alle toepasselijke commando's met betrekking tot de gegevens, om ze op een sterke en redelijke manier te promoten die compatibel en consistent is met het datawarehouse. Daarnaast is het verantwoordelijk voor de netheid en kwaliteit van de gegevens.

vezel transformatie

belasting

Betreffende de technieken van het initieel laden van de gegevens en het periodiek bijwerken van het Data Warehouse.

  • De initiële lading verwijst naar de eerste lading gegevens die het Data Warehouse ontvangt. Over het algemeen is het erg tijdrovend vanwege het grote aantal records dat tot een lange tijdsperiode behoort.
  • Periodieke actualisering verwijst naar het invoegen van kleine hoeveelheden gegevens. Uw doel is om alleen de gegevens die zijn gegenereerd vanaf de laatste update toe te voegen aan de datawarehouse-voorbeelden. Het hangt af van de wensen en eisen van de gebruiker.

Kortom, door het proces van het laden van data is het onderhoud van het Data Warehouse gegarandeerd.

Samenvattend kan worden gesteld dat het ETL-proces als volgt wordt uitgevoerd:

  • De gegevens worden, eenmaal uit de relevante bronnen gehaald, opgeslagen in de interne opslag.
  • Terwijl de gegevens in de interne opslag worden bewaard, worden ze geïntegreerd en getransformeerd.
  • Wanneer de gegevens zijn opgeschoond, worden deze na de vorige stap doorgegeven aan het Data Warehouse.

Rapporten

De rapporten zijn grafische hulpmiddelen waarmee de gebruiker gedetailleerde rapporten kan verkrijgen over de informatie van zijn bedrijf. De manier om met deze rapporten om te gaan is vrij eenvoudig voor de gebruiker, omdat het gemakkelijk te volgen instructies zijn. In principe moet u opties uit een menu selecteren, verwijzend naar de voorwaarden en specificaties van het gepresenteerde onderwerp.

OLAP

Het is het krachtigste onderdeel van het datawarehouse, omdat het de gespecialiseerde multidimensionale query-engine van het systeem bevat.

Het maakt de analyse van de organisatie mogelijk vanuit verschillende historische scenario's. Het projecteert zijn gedrag en evolutie vanuit een multidimensionale visie, dat wil zeggen door verschillende perspectieven, interessante onderwerpen of dimensies te combineren. Hierdoor kunnen trends worden afgeleid door relaties tussen perspectieven te ontdekken die op het eerste gezicht moeilijk te vinden zijn.

Data Mining

VOORBEELDEN-VAN-DATA-MAGAZIJN

Het is vooral een statistisch hulpmiddel waarmee voorspellingen kunnen worden gedaan. Het gaat om het afleiden van gedrag, zonder dat er vooraf vastgestelde regels zijn. Het genereert rapportages in onder meer de vorm van tabellen en grafieken die de besluitvorming op een proactieve manier bevorderen. Het werkt op basis van informatie die al volledig is verwerkt.

Verschil tussen OLAP en datamining

Nadat de belangrijkste aspecten van OLAP en Data Minig zijn overwogen, kan een fundamenteel verschil tussen beide worden vastgesteld.

  • Met behulp van OLAP wordt de huidige situatie van het bedrijf geïnterpreteerd, met snelle antwoorden die de besluitvorming vergemakkelijken.
  • De Data Minig voorspelt situaties, gebaseerd op de studie van verborgen kennis die bepaalde soorten gedrag uitlokt.

Beide systemen hebben dus te maken met het oplossen van verschillende soorten analytische situaties.

Data Minig en de relatie met Data Warehouse

Een Data Minig-systeem is een ondersteunende technologie voor de eindgebruiker, die tot doel heeft nuttige informatie te extraheren uit de informatie in de database van de bedrijven. Met andere woorden, de oorsprong van de informatie die door de Data Minig-algoritmen wordt gebruikt, is meestal historische gegevens in een datawarehouse.

Er moet een integratie zijn tussen Data Minig-technieken en de processen die betrokken zijn bij het Data Warehouse. Dat wil zeggen, om de bedrijfsanalyse te kunnen uitvoeren, moet er overeenstemming zijn tussen de Data Minig, het Data Warehouse en de OLAP-server.

Telkens wanneer Data Warehouse nieuwe resultaten oplevert, kan het bedrijf Data Minig opnieuw toepassen om de besluitvorming te optimaliseren.

Kortom, de Data Minig en het Data Warehouse zijn volledig compatibele tools. Het Data Warehouse biedt geheugen en de Data Minig-intelligentie.

Traditionele databases versus datawarehouse

De analyse van de aspecten die tot nu toe aan het licht zijn gekomen, doet ons begrijpen dat een Data Warehouse verschilt van de databases die de dagelijkse transacties van organisaties ondersteunen. Hier de fundamentele verschillen

  • In traditionele databases is de informatie zo georganiseerd dat deze gemakkelijk kan worden opgevraagd en bijgewerkt. Een Data Warehouse is georganiseerd en gericht op de eindgebruiker, die alleen navraag kan doen.
  • Transactionele databases zorgen voor de dagelijkse verwerking van de gegevens. Het Data Warehouse werkt met historische gegevens, dat wil zeggen overeenkomend met lange perioden.
  • Traditionele databases worden meerdere keren per werkdag benaderd. In een Data Warehouse zijn de uitlezingen en queries minimaal, omdat deze sporadisch worden benaderd.
  • De hoeveelheid gegevens die een Data Warehouse beheert, is veel groter dan die in traditionele databases.
  • De structuur van de transactiebases is stabiel. De structuur van een Data Warehouse varieert volgens zijn eigen evolutie en gebruik.

Vervolgens zullen we enkele Voorbeelden van datawarehouses.

Voorbeelden van datawarehouses

Een landelijk bedrijf dat zich toelegt op de verkoop van schoonmaakartikelen op groot- en kleinhandelsniveau, dat vanwege zijn verkoopvolume ook als middelgroot wordt beschouwd, heeft als hoofddoel het maximaliseren van zijn winst. Evenzo, om meer klanten te krijgen, wilt u uitbreiden naar een nieuw niveau van de markt en later uw productlijn uitbreiden. Een van de belangrijkste beleidslijnen is om continu te verbeteren om een ​​betere positie te krijgen ten opzichte van de concurrenten van de datawarehouse-samples.

VOORBEELDEN-VAN-DATA-MAGAZIJN

De toepassing van een Data Warehouse biedt de organisatie de volgende voordelen.

  • Het stelt gebruikers in staat om een ​​overzicht van het bedrijf te hebben.
  • Transformeer operationele data in analytische informatie, gericht op besluitvorming.
  • Genereer dynamische rapporten die uw analyse vergemakkelijken.
  • Het vergemakkelijkt de vorming van strategieën voor de vervulling van de doelen van de organisatie.
  • Het komt de stabiliteit van de bedrijfsstructuur ten goede.

Een ander voorbeeld van een alledaags datawarehouse verwijst naar het management van een onderwijsinstelling, die tekortkomingen heeft op het gebied van communicatie met haar studenten. Evenzo ontbreekt het aan een uniform informatiecentrum dat al hun informatie heeft. Het doel van de instelling is om studenten te begeleiden tijdens hun loopbaan en na hun afstuderen, om nieuwe voorstellen te doen die de prestaties van de organisatie en de ontwikkeling van studenten verbeteren.

Met de toepassing van een Data Warehouse willen we inspelen op de behoefte van de universiteit. In principe elimineren van dubbele informatie en de aanwezigheid van foutieve gegevens over de studenten, evenals alle informatie die in het algemeen als van slechte kwaliteit wordt beschouwd en die niet relevant is. Bovendien is alle informatie geïntegreerd, waardoor een uniform overzicht van studenten wordt gevormd dat als basis dient voor de juiste ontwikkeling van het project van de instelling.

Ten slotte worden marketingactiviteiten gepromoot, waardoor de universiteit meer voordeel heeft en haar groei helpt door het juiste beheer van informatie.

Kortom, in datawarehouse-voorbeelden biedt het de mogelijkheid om te weten wat er in de organisatie gebeurt, wat er is gebeurd, wat kan gebeuren en waarom. U kunt het artikel zien soorten computervirussen.