Inhoud van de opleiding HBO-programma Data specialist
De opleiding biedt een brede basis op het gebied van big data en bestaat uit zes modules:
Inleiding big data
Je leert wat big data inhoudt en welke technologische ontwikkelingen geleid hebben tot de inzet van big data. De relevantie voor het bedrijfsleven wordt duidelijk aan de hand van een aantal trends en toepassingen. Ook is er aandacht voor de hiermee samenhangende privacy-, veiligheids- en ethische aspecten en de internationale wetgeving. Na afronding heb je inzicht in hoe big data vanuit business- en organisatieperspectief kan bijdragen aan de bedrijfsstrategie en de bedrijfsdoelstellingen. Ook weet je op hoofdlijnen hoe big data-projecten kunnen worden opgezet en begrijp je de impact van big data op het bedrijfsproces en de nieuwe rollen en functies die hierbij ontstaan.
Werken met ongestructureerde data
Deze module gaat in op de opslag en verwerking van data. Zo is er o.a. aandacht voor batchgewijze opslag en verwerking, op streaming gebaseerde verwerking en gevirtualiseerde verwerking. Daarbij maak je kennis met enkele grote platformen die dit mogelijk maken. Zo leer je bijvoorbeeld hoe grote hoeveelheden ongestructureerde data kunnen worden verwerkt met Hadoop en leer je meer over de belangrijkste functionaliteiten van Hadoop en het Hadoop-ecosysteem. Daarnaast komen verschillende NoSQL-databases aan bod. Je past de opgedane kennis meteen toe. Via een eigen console ga je zelf verschillende soorten data verwerken in een Azure Cosmos DB.
Business Intelligence & Databasetechnologie
Big data en data science worden steeds vaker ingezet bij het nemen van strategische bedrijfsbeslissingen. Kennis en de beschikbaarheid van informatie is een belangrijke factor in het realiseren van concurrentievoordeel. Er is dan ook grote behoefte aan professionals die de juiste data kunnen verzamelen én analyseren. Door middel van Business Intelligence ben je in staat om beslissingen te nemen gebaseerd op cijfers.
De module Business intelligence en database technologie leert je om uit grote hoeveelheden beschikbare data noodzakelijke en interessante informatie te halen. Je leert systemen aan elkaar te koppelen, data uit de bedrijfsprocessen inzichtelijk te maken en om te zetten naar informatie waarop je kunt meten en sturen. Je gaat databases organiseren tot data warehouses.
Machine learning met R
Je leert wat Machine learning inhoudt. Aan de hand van praktijkvoorbeelden maak je kennis met algoritmes, regressie en classificatie. Daarbij doe je uiteraard ook de noodzakelijke wiskundige basiskennis op. Daarnaast wordt Machine learning in deze module geplaatst in de context van de organisatie. Wanneer en hoe vaak voer je een Machine learning project uit?
Toegepaste Machine learning met R
In deze module ligt het accent op Machine learning (ML)-programmeren. Je gaat concreet een aantal problemen oplossen door het ML-proces toe te passen. Daarbij worden opdrachten uitgewerkt met behulp van R in een speciaal ingerichte online oefenomgeving. R is een open source programmeertaal om statistische gegevens en gegevensanalyse te managen. Je kunt bij de opdrachten gebruik maken van model datasets, maar het is ook mogelijk om datasets uit de eigen organisatie te gebruiken.
Praktijkintegratieopdracht: Een big data-project managen
In deze module ga je de opgedane kennis en vaardigheden toepassen in de eigen praktijk. Zo word je vaardig in het managen en presenteren van big data projecten. Je werkt hiervoor met een eigen case. Daarbij doorloop je het gehele proces: van het bepalen en afbakenen van het te onderzoeken probleem tot en met het presenteren van het resultaat. In deze presentatie lever je het management de gewenste rapportages, een analyse van de gegevens en de hierbij behorende interpretatie en verdere inzet voor de (strategische) bedrijfsvoering. Het verwerken van data gebeurt m.b.v. Hadoop. Voor het analyseren en visualiseren wordt gebruik gemaakt van de online big data-oefenomgeving.