Data Science

Niet Goed Geld Terug

Gratis Annuleren

Startgarantie

9,9 op basis van 26 ervaringen

Niveau: HBO/WO Trainer Locatie: Den Haag Startdata: 3

Tijdens deze driedaagse cursus leer je hands-on de meest belangrijke en effectieve data science technieken! Je leert de fundamenten van machine learning en gaat aan de slag met het toepassen van regressie, clustering en classificatie.

Prijs: € 1.665,- 1595,-

Mail: farisch@schoolofdatascience.nl

Telefoonnummer:
06 5437 5267 of 070 221 1586

Background Image for School of Data Science Website

Data Science

Niet Goed Geld Terug
Gratis annuleren
Startgarantie
★★★★★ 9,9 op basis van 26 ervaringen

Niveau: HBO/WO Trainer Locatie: Den Haag Startdata: 3
Tijdens deze driedaagse cursus leer je de basis van data science en ga je aan de slag met het toepassen van machine learning concepten op datasets. Na deze cursus ben je in staat zelfstandig aan de slag te gaan met het toepassen van technieken op eigen datasets.

Prijs: 1.665,- 1595,-

Mail: farisch@schoolofdatascience.nl

Telefoonnummer:
06 5437 5267 of 070 221 1586

Background Image for School of Data Science Website

Ervaringen

Hieronder is een selectie te zien van onze blije klanten. Bekijk hier alle recensies.

Bart Vrancken
Bart Vrancken
Directeur Enterprise Risk Management bij de Volksbank
Read More
"Een uitstekende cursus aan de School of Data Science gevolgd over data science. Diverse varianten van supervised, unsupervised en reinforcement learning doorgeakkerd. De trainer legt rustig en duidelijk uit. Als hij merkt dat er meer tijd nodig is, dan wordt deze ingeruimd. De combinatie van theorie en praktijk, waarbij opdrachten gemaakt moeten worden, is een prima manier om wegwijs te worden in python en de libraries van pyhthon. Een aanrader; een basis van wiskunde (A) is wel wenselijk om de cursus up-to-speed te kunnen volgen."
Mitchell Baes
Mitchell Baes
Business Analist
Read More
"Goede en informatieve training waarbij ook echt de tijd werd genomen voor ieder individu. De trainer neemt echt de tijd om alle concepten uit te leggen en daarbij ook voorbeelden te benoemen. De afwisseling van theorie en praktijk is ook ideaal om het zelf onder de knie te krijgen. Verder na de training staat de trainer altijd voor je klaar als je vragen hebt. De cursus is een aanrader voor iedereen die zich op het gebied van Data Science wilt ontwikkelen."
Emiel Wegman
Emiel Wegman
Data Analist bij Zilveren Kruis Achmea
Read More
"De School of Data Science slaagt erin om complexe kennis en vaardigheden op zeer efficiënte wijze over te brengen. Dit doen zij door cursisten in korte tijd precies de juiste handvatten te geven die hen in staat stellen om zelfstandig door te leren. Prettig is ook dat de docenten na de cursussen altijd voor mij klaarstonden om eventuele vragen te beantwoorden."
Isidora Penning de Vries
Isidora Penning de Vries
Lean Six Sigma Black Belt
Read More
"Ik werk al enige tijd als Lean Six Sigma Black Belt en was op zoek naar een efficiëntere manier om data analyses uit te voeren. Voordat de cursus begon heb ik Farisch al gesproken en wat huiswerk gekregen zodat de cursisten ongeveer op hetzelfde niveau begonnen. De uitleg was helder en er was tijd voor uitweidingen op basis van de interesse van de cursisten. Het instructiemateriaal steekt goed in elkaar, met duidelijke opdrachten. Naderhand heb ik nog contact met Farisch gehad met wat vragen over hoe ik bepaalde dingen in de praktijk kon brengen. Deze week heb ik mijn eerste resultaten in mijn bedrijf gepresenteerd en ik heb ook mijn collega's enthousiast kunnen maken over de mogelijkheden van Python en Data Science. Ik zou School of Data Science zeker aanraden."
Razia Mahabier
Razia Mahabier
Cloud Developer
Read More
"Ik heb de les als heel fijn ervaren. Uitleg was helder en duidelijk. Het was heel interactief, waardoor ik mijn aandacht er ook goed bij kon houden. Het fijnste vond ik dat ik mij ook vrij voelde om vragen te stellen."
Daan Sloothaak
Daan Sloothaak
Business & Data Analist
Read More
"Ideale training om bekend te worden op het gebied van Data Science. Farisch weet een uitdagend programma met verschillende onderdelen op een leuke en luchtige manier over te brengen, helemaal afgestemd op het niveau van de cursisten. Door goed te coachen en altijd bereikbaar te zijn voor eventuele vragen (ook na de training) stelt hij je in staat om in korte tijd veel te leren. "
Previous
Next

Informatie

Locatie: Den Haag.
Duur: 3 dagen.
Lestijden: 10:00 – 16:30.
Lesdag: Maandag, dinsdag en woensdag.

Taal: Nederlands/Engels.
Niveau: HBO/WO.

Prijs: €1.665,- 1595,- excl. btw.

Deze cursus incompany organiseren voor je team? Neem contact met ons op!

Startdata

Over de cursus Data Science

Tijdens deze driedaagse cursus leer je hands-on de meest belangrijke en effectieve data science tools. De data science cursus is een brede cursus op het gebied van data-analyse en verwerking (met pandas), machine learning (clustering, regressie en classificatie met scikit-learn) en data visualisatie (matplotlib en seaborn). Deze cursus is geschikt voor mensen die al ervaring hebben met programmeren en die hun vaardigheden willen aanvullen met data science vaardigheden. De cursus Data Science sluit perfect aan op de cursus Python for Data Analysis. Deze cursus kan gevolgd worden als opstap naar een meer gespecialiseerde cursus, zoals bijvoorbeeld Machine Learning of Deep Learning.

Leerdoelen Data Science

Na deze cursus:
  • kun je data analyseren met de pandas library,
  • data visualiseren met behulp van matplotlib en seaborn,
  • begrijp je het verschil tussen supervised, unsupervised en reinforcement learning,
  • begrijp je hoe machine learning modellen leren op basis van gradient descent,
  • kun je data clusteren met optimale parameters,
  • regressie toepassen op datasets om hiermee voorspellingen te doen,
  • classificatie toepassen op datasets om data te classificeren, en
  • een decision tree toepassen op datasets en deze optimaliseren.

Voor wie is de Data Science cursus?

  • Je wilt data science en machine learning concepten leren begrijpen en effectief kunnen toepassen.
  • Je begrijpt de basisconcepten van de programmeertaal Python (zie Python Essentials).
  • Je bent benieuwd naar hoe je het meest effectief de libraries pandas, numpy en scikit-learn kan inzetten en wilt leren werken in Jupyter Notebooks.
data science cursus visualisaties
Rick Cursus Data Science

Afbeelding 1 en 2. Enkele voorbeelden van outputs uit de data science cursus en ons klaslokaal op locatie Rotterdam.

Cursusinhoud Data Science

Dag 1: Intro to Data Science

Tijdens deze dag leer je alle basisbeginselen van de data science libraries in Python: Matplotlib, NumPy, Pandas en Seaborn. Je leert tijdens deze dag data analyseren, transformeren en visualiseren.

Numpy

  • NumPy arrays. Het werken met Big Data vergt dat je op een efficiënte manier kan omgaan met data. NumPy is dé library in Python die berekeningen met veel data gemakkelijk maakt. Je leert werken met de Numpy Array en leert de meest gebruikte NumPy methods.
  • Statistiek in NumPy. Tijdens dit onderdeel leer je hoe je NumPy gebruikt om statistische berekeningen te doen. Hierdoor is het mogelijk om simulaties te maken waarbij je gebruikt maakt van de random methods in NumPy.
  • Wiskundige functies: De NumPy library zit boordevol handige wiskundige functies. Het creëren van functies om als data scientist je data te analyseren wordt hierdoor ontzettend gemakkelijk.

Pandas

  • Introductie DataFrames. Pandas is de ideale tool voor het analyseren van data. Pandas biedt alle functionaliteiten die je hebt in Excel en daarnaast nog véél meer! Dat maakt pandas uiterst geschikt voor degene die willen overstappen van Excel naar Pandas. Je leert in deze module alles over het gebruiken van de Pandas DataFrame. We creëren zelf DataFrames en zullen daarna data importeren vanuit CSV files naar een DataFrame.
  • Samenvattende en beschrijvende methods van Pandas. Pandas biedt ideale functionaliteiten om data in één oogopslag te beschrijven. Op deze manier kun je in een handomdraai je data analyseren, missende waarden bekijken en de verdeling van je data achterhalen.
  • Slicing en filtering van data in Pandas. Je leert in deze module de pandas methods te gebruiken voor het selecteren van data binnen een pandas dataframe. Daarnaast leer je ook data filteren op basis van condities. Je leert hoe je condities combineert door efficiënt gebruik te maken van pandas methods. We sluiten deze module af door te leren hoe je for loops gebruikt in pandas DataFrames met de apply method.
  • Groeperen van data. Je kunt heel handig gebruik maken van pandas om data te groeperen. De pandas methods die hiervoor gemaakt zijn tonen veel gelijkenissen met de programmeertaal SQL. Deze gegroepeerde data visualiseren gaat heel handig middels de ingebouwde visualisatie methoden in pandas. Pandas en Matplotlib werken hand in hand samen, waardoor jij op een simpele manier je data kunt visualiseren!
  • Omgaan met missende data. Missende data kunnen je dataset flink overhoopgooien! Je leert in deze module welke pandas methods je kan gebruiken om om te kunnen gaan met missende data.
  • Visualiseren van data in pandas. De pandas library biedt ontzettend veel mogelijkheden om data direct vanuit de DataFrame te visualiseren. Zo maak je heel eenvoudig staafdiagrammen (bar charts), tijdsreeksgrafieken of scatterplots!

Visualisatie

  • Matplotlib. Matplotlib is een van de meest gebruikte datavisualisatie tools binnen het Python data science ecosysteem. Matplotlib stelt je in staat gemakkelijk allerlei grafieken te maken en te combineren. Tijdens deze module leer je grafieken te maken vanuit de Python list, NumPy en pandas. Je leert onder andere hoe je scatterplots maakt, histogrammen en subplots.
  • Seaborn. Seaborn is een datavisualisatie library die gebaseerd is op Matplotlib. Seaborn stelt je in staat complexe grafieken te maken, die vooral bedoeld zijn voor het visualiseren van statistische verdelingen. Je leert in deze module onder andere hoe je een boxplot, een heatmap en een violin plot maakt met seaborn.

Dag 2: Intro to Machine Learning

Tijdens deze dag leer je de fundamenten van machine learning en ga je aan de slag met het bouwen van regressie en clustering modellen.

Fundamenten van machine learning

  • Supervised learning. Supervised Learning is een van de meest gebruikte learning technieken van hedendaagse machine learning modellen. Bij Supervised Learning leren modellen van gelabelde data. Dit kunnen gelabelde afbeeldingen zijn van katten en honden of een dataset met informatie over huizenprijzen. We leren hier hoe je een Supervised Learning algoritme kan herkennen. Ook leer je welke data je moet verzamelen om zelf Supervised Learning te kunnen toepassen.
  • Unsupervised learning. Unsupervised Learning is een algoritme dat leert door patronen te herkennen. We leren hier welke soort Unsupervised Learning algoritmen er zijn. Ook leren we welke toepassingen Unsupervised Learning algoritmen hebben. We zullen hierbij enkele voorbeeld cases bespreken.
  • Reinforcement learning. Reinforcement Learning is een algoritme dat leert door Agents een beloning of een straf te geven voor bepaalde handelingen. We zullen enkele eerder ontwikkelde algoritmes bespreken en erachter komen hoe dit algoritme het best ingezet kan worden.
  • Test set/train set. Voor het goed opzetten van een machine learning model is het heel belangrijk een scheiding te maken in je test en train set. Op deze manier kun je op een unbiased manier je hyperparameters optimaliseren. In deze module leer je waarom je dat doet en op welke manier je dat het beste kan doen.
  • Bias en variance (overfitting). Het creëren van een optimaal machine learning model, betekent een goede balans vinden in de complexiteit van het model. Je leert in deze module alles over het optimaliseren van het model en wat de gevolgen zijn van overfitting en underfitting.

Regressie

  • Cost function en gradient descent. Hier leer je alles over hoe machine learning modellen leren middels. Je leert het concept van de cost function, leer verschillende soorten cost functions en leert wat Gradient Descent is. Ook leer je hoe je optimaal parameters kiest voor Gradient Descent.
  • Regressie in sci-kit learn. In deze module pas je de geleerde concepten toe voor het voorspellen van huizenprijzen. Je leert de resultaten analyseren en bekijkt hoe goed jouw model het doet.
  • Residu analyse. Middels een residu analyse bekijken we hoe we parameters het beste kunnen kiezen in het voorspelmodel.

Clustering

  • K-means. Leer hier alles over het K-means clustering algoritme. Je leert hoe je data clustert op basis van een K aantal centrumpunten en hoe je een optimaal aantal centrumpunten kiest. Ook leer je het nut van data normaliseren of standaardiseren.
  • Clustering toepassen op de Iris dataset. Je past de theorie van K-means clustering toe op de Iris dataset. Hier cluster je de data van de Iris flower data set en leer je clusters herkennen.

Dag 3: Classificatiemodellen

Tijdens deze dag leer je drie verschillende algoritmes voor het classificeren van data.

Classificatie

  • KNN. In deze module leer je data classificeren op basis van het KNN (k-nearest neighbors) algoritme. Een algoritme dat leert door te kijken naar dichtbijgelegen datapunten. Je leert hier voor welk soort data en vraagstukken dit algoritme geschikt is. Ook leer je hoe je op een zorgvuldige manier de juiste parameters kiest. Daarnaast leer je alle voor en nadelen van dit algoritme. We sluiten het theorie gedeelte af met uitbreidingen op het algoritme die het algoritme nauwkeuriger maken.
  • Classificatie met diabetes dataset. We passen dit algoritme toe op een dataset met mensen die wel of niet diabetes hebben. De uitdaging is hier om diabetes te kunnen voorspellen aan de hand van verschillende factoren.
  • Precision, recall en F1-score. Wanneer we classificatie algoritmen gebruiken, hebben we goede graadmeters nodig om het algoritme te kunnen beoordelen op kwaliteit. In deze module leer je hoe je dit systematisch kan doen.
  • SVM. In deze module leer je over het SVM (Support Vector Machine) algoritme. We behandelen de verschillen tussen KNN vs. SVM. Je leert de voordelen van dit algoritme en hoe je systematisch parameters kiest.

Decision Trees, Regression Trees en Random Forest

  • Information Gain/Gini Coëfficiënt. We ontrafelen de mysteries achter machine learning met decision trees! Leer met de hand decision trees maken door de information gain per splitsing te berekenen. Je leert hiermee de theorie achter information gain en decision trees. Je begrijpt hierdoor op een fundamentele manier hoe dit soort algoritmes werken.
  • Overfitting. Ook decision trees hebben last van overfitting. We leren waarom decision trees overfitten en welke handvatten er zijn op dit in de hand te houden. We leren hier systematisch belangrijke parameters aan te passen.
  • Decision Trees toepassen op regressie probleem. We zullen de theorie toepassen op een dataset en bekijken hoe goed decision trees waarden kunnen voorspellen. Je zult hier parameters aanpassen om de decision tree te optimaliseren.

Extra informatie over de Data Science cursus

  • De cursussen worden gegeven in kleine groepen van maximaal 5 personen. Dit doen wij omdat wij geloven dat persoonlijke aandacht voor de beste leerervaring zorgt.
  • Je hebt voor deze cursus een eigen laptop nodig om mee te doen. Je kunt van tevoren gratis de Anaconda software downloaden via deze link.
  • Tijdens de cursus zal er een lunch worden voorzien. Heb je dieetvoorkeuren? Laat het ons weten! Dan zorgen wij voor een aangepaste lunch.

Veelgestelde vragen

Onder data science verstaat School of Data Science een interdisciplinair veld met daarin alle methodieken, systemen en processen die inzichten halen uit data. Het wetenschappelijk veld waaruit data science inzichten onttrekt zijn onder andere data mining, machine learning, statistiek en informatica.

De driedaagse data science cursus is onderdeel van de data science opleiding (zie data science learning  journey). De data science opleiding is in deeltijd te volgen. Je bent vrij de modules zelf in te plannen en je in te schrijven voor de beschikbare data die School of Data Science gepland heeft staan. Mocht je hier nog vragen over hebben, kun je contact met ons opnemen.

Onze deelnemers zijn te verdelen in drie groepen: recent afgestudeerden, mensen die dagelijks met data werken en leidinggevenden. De groep recent afgestudeerden volgt deze opleiding vaak als verbreding van het kennisniveau. Zij leren technieken die ze niet bij de studie gehad hebben om data te analyseren, te verwerken en vervolgens voorspellingen te doen. Het merendeel van deze groep noemt zichzelf ‘Data Scientist’ in hun functieomschrijving na het volgen van de data science opleiding. De groep die dagelijks met data werkt gebruikt de data science opleiding vaak om meer te kunnen doen met de data die beschikbaar is binnen hun organisatie. Vaak werken ze al met een programma als Excel, SAS of MATLAB. Vaak hebben deze mensen al iets van Data Analist of Data Scientist als functieomschrijving. De groep leidinggevenden stuurt vaak een groep aan die werken met data. Voor hen is deze opleiding handig om mee te kunnen praten over data science concepten en technieken. Ook leren ze deze concepten en technieken begrijpen op een niveau dat ze zelf nieuwe modellen en algoritmes kunnen voorstellen.

Ja, zeker! Vaak helpt het wel om wat achtergrondkennis te hebben. Dit kan domeinkennis zijn, kennis van statistiek en/of wiskunde, kennis in een andere programmeertaal of kennis van Excel.

Ongeveer 40% van onze cursisten valt in de categorie ‘beginner’. Dat betekent dat er weinig tot geen kennis is van bovengenoemde achtergrondkennis. Al deze cursisten hebben de data science opleiding als positief of zeer positief ervaren.

Scroll to Top