training
Data Engineering on Azure (DP-203)
Doe hands-on en diepgaande ervaring op met de Azure Data Engineering toolbox
Beschrijving
In deze training leer je over data engineering op het Azure data platform.
Hierbij begint je met de compute en storage technologiën die je gebruikt om een analytics-oplossing te bouwen. Vervolgens ontdek je hoe je analytics serving layers ontwerpt en hoe je bronbestanden en -systemen kunt inzetten.
Je gaat interactief data exploration toepassen op bestanden in een data lake middels Serverless SQL pools of Apache Spark pools. Deze bestanden leer je vervolgens op verschillende manieren ontsluiten op Azure Synapse Analytics of Azure Databricks, of met Azure Data Factory en Azure Synapse pipelines. Je maakt daarbij gebruik van COPY, Polybase en andere technologiën om ook bij big data performant te blijven. Deze data leer je daarna te transformeren met dezelfde technologiën.
Je leert over het belang van security om te zorgen dat data zowel at rest als in transit volledig beschermd is.
Uiteindelijk leer je de data in te zetten voor real-time analytics oplossingen.
Deze training geldt ook als voorbereiding op het examen DP-203: Data Engineering on Microsoft Azure. Heb je dit examen gehaald dan ben je Microsoft Certified: Azure Data Engineer Associate. Examenvoucher is niet inbegrepen.
Benodigde voorkennis
Ervaring met data engineering. Onderwerpen uit Azure Data Fundamentals
Onderwerpen
1: Get started with data engineering on Azure
In most organizations, a data engineer is the primary role responsible for integrating, transforming, and consolidating data from various structured and unstructured data systems into structures that are suitable for building analytics solutions. An Azure data engineer also helps ensure that data pipelines and data stores are high-performing, efficient, organized, and reliable, given a specific set of business requirements and constraints.
Lessons
- Introduction to data engineering on Azure
- Introduction to Azure Data Lake Storage Gen2
- Introduction to Azure Synapse Analytics
2: Analyze data with Azure Synapse Analytics serverless SQL pools
If you have large volumes of data stored as files in a data lake, you'll need a convenient way to explore and analyze the data they contain. Azure Synapse Analytics enables you to apply the SQL skills you use in a relational database to files in a data lake.
Lessons
- Use Azure Synapse serverless SQL pool to query files in a data lake
- Use Azure Synapse serverless SQL pool to transform data in a data lake
- Create a lake database in Azure Synapse Analytics
3: Perform data engineering with Azure Synapse Apache Spark Pools
Apache Spark is a highly scalable distributed processing solution for big data analytics and transformation. You can leverage its power in Azure Synapse Analytics by using Spark pools.
Lessons
- Analyze data with Apache Spark in Azure Synapse Analytics
- Transform data with Spark in Azure Synapse Analytics
- Use Delta Lake in Azure Synapse Analytics
4: Work with data warehouses using Azure Synapse Analytics
Relational data warehouses are at the heart of many business intelligence and enterprise analytics solutions. You can use Azure Synapse Analytics to implement highly scalable data warehouses in the cloud.
Lessons
- Analyze data in a relational data warehouse
- Load data into a relational data warehouse
5: Transfer and transform data with Azure Synapse Analytics pipelines
Azure Synapse Analytics enables data integration through the use of pipelines, which you can use to automate and orchestrate data transfer and transformation activities.
Lessons
- Build a data pipeline in Azure Synapse Analytics
- use Spark Notebooks in an Azure Synapse Pipeline
6: Work with hybrid transactional and analytical processing (HTAP) solutions using Azure Synapse Analytics
Hybrid Transactional and Analytical Processing (HTAP) is a technique for near real time analytics without a complex ETL solution. In Azure Synapse Analytics, HTAP is supported through Azure Synapse Link.
Lessons
- Plan hybrid transactional and analytical processing using Azure Synapse Analytics
- Implement Azure Synapse Link with Azure Cosmos DB
- Implement Azure Synapse Link for SQL
7: Implement a data streaming solution with Azure Stream Analytics
Stream processing enables you to capture and analyze data in real-time. Azure Stream Analytics is a cloud-based stream processing engine that you can use to build highly scalable real-time analytics solutions.
Lessons
- Get started with Azure Stream Analytics
- Ingest streaming data using Azure Stream Analytics and Azure Synapse Analytics
- Visualize real-time data with Azure Stream Analytics and Power BI
8: Govern data across an enterprise
Use Microsoft Purview to register and scan data, catalog data artifacts, find data for reporting, and manage Power BI artifacts to improve data governance in your organization.
Lessons
- Introduction to Microsoft Purview
- Integrate Microsoft Purview and Azure Synapse Analytics
9: Data engineering with Azure Databricks
Learn how to harness the power of Apache Spark and powerful clusters running on the Azure Databricks platform to run large data engineering workloads in the cloud.
Lessons
- Explore Azure Databricks
- Use Apache Spark in Azure Databricks
- Use Delta Lake in Azure Databricks
- Use SQL Warehouses in Azure Databricks
- Run Azure Databricks Notebooks with Azure Data Factory
Planning
Startdatum | Duur | Locatie | |
---|---|---|---|
24 februari 202525 februari 202526 februari 202527 februari 2025 | 4 dagen | Utrecht / Remote Dit is een hybride training die remote gevolgd kan worden. Meer informatie Utrecht / Remote Dit is een hybride training die remote gevolgd kan worden. Meer informatie Utrecht / Remote Dit is een hybride training die remote gevolgd kan worden. Meer informatie Utrecht / Remote Dit is een hybride training die remote gevolgd kan worden. Meer informatie | Inschrijven |
Incompany of persoonlijk advies nodig?
Onze opleidingsadviseurs denken graag met je mee om een persoonlijk advies te geven of een incompany training binnen jouw organisatie te vinden.
Voorkennis trainingen
Vervolgtrainingen
Certificering
De kennis uit deze training sluit aan bij deze certificeringen.
"Deze training was direct toepasbaar op het project"Cursist
-
Hoge waardering
-
Praktijkgerichte trainingen
-
Gecertificeerde trainers
-
Eigen docenten