Data Science

Locatie: Den Haag/Rotterdam.
Duur: 3 dagen.
Lestijden: 10:00 – 16:30.
Lesdagen: Maandag, dinsdag & woensdag.

Taal: Python.
Niveau: Gevorderd.

Investering: €1665,- excl. btw.

Startdata

Tijdens deze 3-daagse cursus leer je hands-on de meest belangrijke en effectieve data science tools. De data science cursus is een brede cursus op het gebied van data analyse (clustering, regressie en classificatie), verwerking (met pandas) en data visualisatie. Deze cursus is geschikt voor mensen die al ervaring hebben met programmeren (bij voorkeur programmeren met Python) en die hun vaardigheden willen aanvullen met data science vaardigheden. Deze cursus kan gevolgd worden als opstap naar een meer gespecialiseerde cursus, zoals bijvoorbeeld Machine Learning of Deep Learning.

Voor wie

Deze cursus is iets voor jou als:

  • Je wilt data science en machine learning concepten leren begrijpen en effectief kunnen toepassen.
  • Je begrijpt de basisconcepten van de programmeertaal Python (zie Python Essentials.
  • Je bent benieuwd naar hoe je het meest effectief de libraries pandas, numpy en scikit-learn kan inzetten.

Cursusinhoud

Numpy

  • Numpy Arrays: slicing, filtering en operatoren.
  • Statistische verdelingen.
  • Wiskundige functies.

Pandas

  • Dataframes: methodes, slicing en filtering.
  • Beschrijvende functies.
  • Groeperen van data.
  • Omgaan met missende data.

Visualisatie

  • Matplotlib: basis plots en plotten vanuit pandas.
  • Seaborn: geavanceerde plots.

Fundamenten van machine learning

  • Supervised learning.
  • Unsupervised learning.
  • Reinforcement learning.
  • Test set/train set.
  • Bias en variance (overfitting).

Regressie

  • Cost function en gradient descent.
  • Regressie in sci-kit learn: voorspellen van huizenprijzen.
  • Residu analyse.

Clustering

  • K-means.
  • Clustering in de Iris dataset.

Classificatie

  • KNN.
  • Classificatie met diabetes dataset.
  • Precision, recall en f1-score.
  • SVM

Decision Trees, Regression Trees en Random Forest

  • Information Gain/Gini Coëfficiënt.
  • Overfitting.
  • Random Forest toepassen op regressie probleem.

Optioneel: neurale netwerken.

  • Waarom neurale netwerken?
  • Fundamenten van neurale netwerken.
  • Neurale netwerken toegepast op simpele classificatie problemen.
Enkele voorbeelden (screenshots) van outputs uit de data science cursus:
Data Science Cursus Heatmap

Afbeelding 1: Heatmap van correlatie coefficienten met behulp van Seaborn.

Afbeelding 2: Fitten van een simpele lineaire regressie model op een gesimuleerde dataset van huizenprijzen.

Afbeelding 3: De output van een decision tree model.

Extra informatie

  • De cursussen worden gegeven in kleine groepen van maximaal 5 personen (gemiddeld 3 personen per cursus). Dit doen wij omdat wij geloven dat persoonlijke aandacht voor de beste leerervaring zorgt.
  • Je hebt voor deze cursus een eigen laptop nodig om mee te doen. Je hoeft van te voren geen software te installeren. Als je alle software op je eigen laptop wilt hebben, kun je gratis het softwarepakket Anaconda downloaden.
  • Tijdens de cursus zal er een lunch worden voorzien. Heb je dieetvoorkeuren? Laat het ons weten! Dan zorgen wij voor een aangepaste lunch.

Ervaringen

Bart Rentenaar – IT Manager Data bij VIVAT

“Het is belangrijk de techniek te begrijpen, al is het maar om begrip te krijgen over welke processen een data scientist moet doorlopen van A t/m Z.”

Jeffrey Gerrits – Marketing Data Analist bij Windesheim

“Drie dagen die best wel intensief waren. Er werd heel veel kennis gedeeld, wat ik zelf heel fijn vond. Niet alleen theoretische kennis, maar ook vervolgens die kennis vertalen naar Python.”

Call Now Button

Corona update: onze cursussen gaan door in kleine groepen met inachtneming van de veiligheidsmaatregelen van het RIVM.

X