Analyzing Big Data with Microsoft R

Mail ons Training Analyzing Big Data with Microsoft R

Info Support Cursuscode
MS20773
Leverancier (code)
Microsoft (20773)
Duur
3 dagen

Leer Microsoft R Server te gebruiken voor het analyseren van grote datasets

Cursusbeschrijving

In deze training maakt u kennis met Microsoft R Server; ontwikkelt voor het hosten en beheren van parallelle en gedistribueerde R-processen.
Door R en Microsoft R Server te gebruiken doet u kennis en vaardigheden op rondom het werken met grote datasets. Ook leert u Microsoft R Server te gebruiken met Hadoop of Apache Spark clusters, of een DBMS zoals SQL Server.
Na voltooiing van dit vak kunt u:
- Uitleggen hoe Microsoft R Server en Microsoft R Client werken
- R Client met R Server gebruiken om big data, opgeslagen in verschillende data stores, te onderzoeken
- Big data visualiseren met grafieken en diagrammen
- Grote sets data transformeren en opschonen
- Opties toepassen om analysetaken in parallelle processen te splitsen
- Regressiemodellen vanuit big data bouwen en evalueren
- Partitioning models vanuit big data bouwen, scoren en deployen
- R in SQL Server en Hadoop omgevingen gebruiken

Cursusdata, locaties en tarief

Deze training kan in maatwerk- of incompany worden verzorgd. Neem contact met ons op voor meer informatie.

Cursusinhoud

 • 'Microsoft R Server and R Client’ introduceert Microsoft R Server en R Client, en geeft een overzicht van de ScaleR functies.
 • ‘Exploring Big Data’ beschrijft hoe u ScaleR databronnen kunt gebruiken big data te lezen en samen te vatten in verschillende contexten.
 • ‘Visualizing Big Data’ laat zien hoe u het ggplot2 pakket gebruikt om samen met de ScaleR functies grafieken en diagrammen te maken van big data.
 • ‘Processing Big Data’ beschrijft hoe u grote datasets kunt transformeren en opschonen.
 • ‘Parallelizing Analysis Operations’ leert u ScaleR en PEMA classes te gebruiken om uw analyse in parallelle taken op te splitsen.
 • ‘Generating and Evaluating Regression Models' beschrijft hoe u regressiemodellen voor grote datasets bouwt en evalueert.
 • 'Creating and Evaluating Partitioning Models' laat zien hoe u partitioneringsmodellen bouwt en scoort.
 • 'Processing Big Data in SQL Server and Hadoop' demonstreert hoe u R gebruikt in SQL Server en Hadoop omgevingen.

Benodigde voorkennis

Om zonder problemen dit vak te volgen raden wij aan dat u: - Enige ervaring heeft met R en bekende R pakketten. - Kennis heeft over algemene statistische methoden en best practices op het gebied van data-analyse. - Een goed begrip heeft van relationele databases.

Cursusmateriaal

 • Digitaal Engelstalig materiaal van Microsoft (MOC) met labs om te oefenen.

Gerelateerde cursussen

Doelgroep

 • Ontwikkelaar
 • Data Solutions Specialist
 • BI Engineer
 • Data Scientist

Heeft u vragen?

U kunt ons telefonisch bereiken via de volgende nummers:
Nederland: +31 318 501 119
België: +32 15 286 370

Stuurt u liever een mail?
Nederland: training.nl@infosupport.com
België: training.be@infosupport.com

Mail us Training Analyzing Big Data with Microsoft R

Info Support Course code
MS20773
Supplier (code)
Microsoft (20773)
Length
3 days

Learn how to use Microsoft R Server to analyze large datasets

Course outline

You will learn about Microsoft R Server, Microsoft’s solution for hosting and managing parallel and distributed R processes. Using R and Microsoft R Server, you will gain knowledge and skills related to working with big datasets. You will also learn how to use Microsoft R Server to manage Hadoop or Apache Spark clusters and database systems such as SQL Server.
After completing this course, you will be able to:
- Explain how Microsoft R Server and Microsoft R Client work.
- Use R Client with R Server to explore big data held in different data stores.
- Visualize big data by using graphs and plots.
- Transform and clean big data sets.
- Implement options for splitting analysis jobs into parallel tasks.
- Build and evaluate regression models generated from big data.
- Create, score, and deploy partitioning models generated from big data.
- Use R in SQL Server and Hadoop environments.

Course dates, locations and price

This course can be conducted as a tailormade- or an incompany training. Please contact us for more information.

Course Contents

 • 'Microsoft R Server and R Client’ provides an introduction to Microsoft R Server and R Client, and an overview of the ScaleR functions
 • 'Exploring Big Data’ describes a how to use ScaleR data sources to read and summarize big data in different compute contexts.
 • 'Visualizing Big Data’ shows how to use the ggplot2 package, and the ScaleR functions, to generate plots and graphs of big data.
 • 'Processing Big Data’ describes how to transform and clean big data sets.
 • ‘Parallelizing Analysis Operations’ shows how to use ScaleR and PEMA classes to split analysis jobs into parallel tasks.
 • ‘Generating and Evaluating Regression Models' describes how build and evaluate regression models generated from big data sets.
 • 'Creating and Evaluating Partitioning Models' shows how to create and score partitioning models generated from big data sets.
 • 'Processing Big Data in SQL Server and Hadoop' describes how to use R in SQL Server and Hadoop environments.

Course prerequisites

Students who attend this course should have: - Experience using R and common R packages - Knowledge of common statistical methods and data analysis best practices. -Working knowledge of relational databases.

Course material

 • Digital course material from Microsoft with labs.

Related courses

Target Audience

 • Developer
 • Data Solutions Specialist
 • BI Engineer
 • Data Scientist

Do you have any questions?

You can reach us through the following numbers:
Netherlands: +31 318 501 119
Belgium: +32 15 286 370

Rather send an email?
Netherlands: training.nl@infosupport.com
Belgium: training.be@infosupport.com