Analyzing Big Data with Microsoft R

Inschrijven Training Analyzing Big Data with Microsoft R

Info Support Cursuscode
MS20773
Leverancier (code)
Microsoft (20773)
Duur
3 dagen

Leer Microsoft R Server te gebruiken voor het analyseren van grote datasets

Cursusbeschrijving

In deze training maakt u kennis met Microsoft R Server; ontwikkelt voor het hosten en beheren van parallelle en gedistribueerde R-processen.
Door R en Microsoft R Server te gebruiken doet u kennis en vaardigheden op rondom het werken met grote datasets. Ook leert u Microsoft R Server te gebruiken met Hadoop of Apache Spark clusters, of een DBMS zoals SQL Server.
Na voltooiing van dit vak kunt u:
- Uitleggen hoe Microsoft R Server en Microsoft R Client werken
- R Client met R Server gebruiken om big data, opgeslagen in verschillende data stores, te onderzoeken
- Big data visualiseren met grafieken en diagrammen
- Grote sets data transformeren en opschonen
- Opties toepassen om analysetaken in parallelle processen te splitsen
- Regressiemodellen vanuit big data bouwen en evalueren
- Partitioning models vanuit big data bouwen, scoren en deployen
- R in SQL Server en Hadoop omgevingen gebruiken

Cursusdata, locaties en tarief

Startdatum Locatie Inschrijven
21 mei 2019 Veenendaal inschrijven
12 augustus 2019 Veenendaal inschrijven
19 november 2019 Veenendaal inschrijven

Het tarief voor deze training is € 1.755,00 per persoon.

Neem contact met ons op indien er geen (geschikte) datum gevonden kan worden.

Indien u deze training in Mechelen wilt volgen, neem dan contact op met ons via dit e-mailadres of bel naar +32 (0)15 28 63 70.

Cursusinhoud

  • 'Microsoft R Server and R Client’ introduceert Microsoft R Server en R Client, en geeft een overzicht van de ScaleR functies.
  • ‘Exploring Big Data’ beschrijft hoe u ScaleR databronnen kunt gebruiken big data te lezen en samen te vatten in verschillende contexten.
  • ‘Visualizing Big Data’ laat zien hoe u het ggplot2 pakket gebruikt om samen met de ScaleR functies grafieken en diagrammen te maken van big data.
  • ‘Processing Big Data’ beschrijft hoe u grote datasets kunt transformeren en opschonen.
  • ‘Parallelizing Analysis Operations’ leert u ScaleR en PEMA classes te gebruiken om uw analyse in parallelle taken op te splitsen.
  • ‘Generating and Evaluating Regression Models' beschrijft hoe u regressiemodellen voor grote datasets bouwt en evalueert.
  • 'Creating and Evaluating Partitioning Models' laat zien hoe u partitioneringsmodellen bouwt en scoort.
  • 'Processing Big Data in SQL Server and Hadoop' demonstreert hoe u R gebruikt in SQL Server en Hadoop omgevingen.

Benodigde voorkennis

Om zonder problemen dit vak te volgen raden wij aan dat u: - Enige ervaring heeft met R en bekende R pakketten. - Kennis heeft over algemene statistische methoden en best practices op het gebied van data-analyse. - Een goed begrip heeft van relationele databases.

Cursusmateriaal

  • Digitaal Engelstalig materiaal van Microsoft (MOC) met labs om te oefenen.

Gerelateerde cursussen

Doelgroep

  • Data Scientist
  • Data Engineer
  • Ontwikkelaar
  • BI Engineer

Heeft u vragen?

U kunt ons telefonisch bereiken via de volgende nummers:
Nederland: +31 318 501 119
België: +32 15 286 370

Stuurt u liever een mail?
Nederland: training.nl@infosupport.com
België: training.be@infosupport.com

Inschrijven Training Analyzing Big Data with Microsoft R

Info Support Course code
MS20773
Supplier (code)
Microsoft (20773)
Length
3 days

Learn how to use Microsoft R Server to analyze large datasets

Course outline

You will learn about Microsoft R Server, Microsoft’s solution for hosting and managing parallel and distributed R processes. Using R and Microsoft R Server, you will gain knowledge and skills related to working with big datasets. You will also learn how to use Microsoft R Server to manage Hadoop or Apache Spark clusters and database systems such as SQL Server.
After completing this course, you will be able to:
- Explain how Microsoft R Server and Microsoft R Client work.
- Use R Client with R Server to explore big data held in different data stores.
- Visualize big data by using graphs and plots.
- Transform and clean big data sets.
- Implement options for splitting analysis jobs into parallel tasks.
- Build and evaluate regression models generated from big data.
- Create, score, and deploy partitioning models generated from big data.
- Use R in SQL Server and Hadoop environments.

Course dates, locations and price

Startdate Location Register
21 May 2019 Veenendaal register
12 August 2019 Veenendaal register
19 November 2019 Veenendaal register

doorgangsgarantie = Guaranteed to start.
The price for this course is € 1,755.00 per person.

Please contact us for other (suitable) dates and/or location.

If you want to follow this course in Mechelen, please contact us at this email adress or call +32 (0)15 28 63 70.

Course Contents

  • 'Microsoft R Server and R Client’ provides an introduction to Microsoft R Server and R Client, and an overview of the ScaleR functions
  • 'Exploring Big Data’ describes a how to use ScaleR data sources to read and summarize big data in different compute contexts.
  • 'Visualizing Big Data’ shows how to use the ggplot2 package, and the ScaleR functions, to generate plots and graphs of big data.
  • 'Processing Big Data’ describes how to transform and clean big data sets.
  • ‘Parallelizing Analysis Operations’ shows how to use ScaleR and PEMA classes to split analysis jobs into parallel tasks.
  • ‘Generating and Evaluating Regression Models' describes how build and evaluate regression models generated from big data sets.
  • 'Creating and Evaluating Partitioning Models' shows how to create and score partitioning models generated from big data sets.
  • 'Processing Big Data in SQL Server and Hadoop' describes how to use R in SQL Server and Hadoop environments.

Course prerequisites

Students who attend this course should have: - Experience using R and common R packages - Knowledge of common statistical methods and data analysis best practices. -Working knowledge of relational databases.

Course material

  • Digital course material from Microsoft with labs.

Related courses

Target Audience

  • Data Scientist
  • Data Engineer
  • Developer
  • BI Engineer

Do you have any questions?

You can reach us through the following numbers:
Netherlands: +31 318 501 119
Belgium: +32 15 286 370

Rather send an email?
Netherlands: training.nl@infosupport.com
Belgium: training.be@infosupport.com