0% found this document useful (0 votes)

202 views12 pages

Databricks_Data_Engineer_Associate_Practice

The document contains practice questions for the Databricks Certified Data Engineer Associate exam, covering topics such as Apache Spark, data governance, data ingestion, the Databricks Lakehouse platform, Delta Lake, and ETL pipelines. Each question is followed by multiple-choice answers, with the correct answer indicated. The questions focus on key concepts and functionalities relevant to using Databricks and Spark effectively.

Uploaded by

Maneet Mathur

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

202 views12 pages

Databricks_Data_Engineer_Associate_Practice

Uploaded by

Maneet Mathur

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 12

Databricks Certified Data Engineer Associate - Practice Questions

Apache Spark & Notebooks

Q: What is a common use of markdown cells in notebooks?

A. C++

B. Returns all elements of the DataFrame as a list

C. Documentation

D. To run another notebook

Answer: C

Q: What is a benefit of using notebooks in Databricks?

A. Returns all elements of the DataFrame as a list

B. C++

C. Supports interactive development

D. Documentation

Answer: C

Q: Which language is NOT supported in Databricks notebooks?

A. To run another notebook

B. Supports interactive development

C. df.cache()

D. C++

Answer: D

Q: How do you cache a DataFrame in Spark?

A. Documentation

B. df.cache()

C. DataFrame

D. Supports interactive development

Answer: B

Q: How is SparkSession accessed in Databricks?

A. spark

B. C++

C. Documentation

D. To run another notebook

Answer: A
Databricks Certified Data Engineer Associate - Practice Questions

Q: How do you write comments in Python notebooks?

A. To run another notebook

B. # This is a comment

C. spark

D. C++

Answer: B

Q: What does `display(df)` do?

A. Supports interactive development

B. # This is a comment

C. Renders a DataFrame in a tabular format with visualization options

D. spark

Answer: C

Q: What is `%run` used for in notebooks?

A. Supports interactive development

B. To run another notebook

C. spark

D. DataFrame

Answer: B

Q: What does the `.collect()` method do?

A. Renders a DataFrame in a tabular format with visualization options

B. DataFrame

C. df.cache()

D. Returns all elements of the DataFrame as a list

Answer: D

Q: What does `spark.read.csv()` return?

A. C++

B. df.cache()

C. Documentation

D. DataFrame

Answer: D

Data Governance & Security

Databricks Certified Data Engineer Associate - Practice Questions

Q: Which layer defines table-level access?

A. Stores metadata about data assets

B. Catalog permissions

C. A shared environment for users

D. Data permissions and lineage

Answer: B

Q: Who defines data access policies in Unity Catalog?

A. Data permissions and lineage

B. Through access control lists (ACLs)

C. Stores metadata about data assets

D. Data stewards or admins

Answer: D

Q: What does Unity Catalog manage?

A. A shared environment for users

B. Data permissions and lineage

C. Through access control lists (ACLs)

D. Role-Based Access Control

Answer: B

Q: How are user permissions granted?

A. Role-Based Access Control

B. Stores metadata about data assets

C. Through access control lists (ACLs)

D. Assign roles to users

Answer: C

Q: What is a workspace in Databricks?

A. Tracks access logs and usage history

B. Role-Based Access Control

C. Assign roles to users

D. A shared environment for users

Answer: D

Q: What is one way to restrict data access?

Databricks Certified Data Engineer Associate - Practice Questions

A. Data permissions and lineage

B. Tracking data origin and transformations

C. Catalog permissions

D. Assign roles to users

Answer: D

Q: What is data lineage?

A. A shared environment for users

B. Catalog permissions

C. Data stewards or admins

D. Tracking data origin and transformations

Answer: D

Q: What is RBAC?

A. Assign roles to users

B. Tracks access logs and usage history

C. Role-Based Access Control

D. Data stewards or admins

Answer: C

Q: What is the role of a metastore?

A. Role-Based Access Control

B. Stores metadata about data assets

C. Tracks access logs and usage history

D. Data stewards or admins

Answer: B

Q: How does Unity Catalog improve auditing?

A. Assign roles to users

B. Tracks access logs and usage history

C. Data stewards or admins

D. Catalog permissions

Answer: B

Data Ingestion & Transformation

Q: Which tool helps with transformation jobs?

Databricks Certified Data Engineer Associate - Practice Questions

A. JSON

B. XLS

C. Databricks Workflows

D. df.write.format('delta').save('path')

Answer: C

Q: What is a common data ingestion format in Databricks?

A. XLS

B. Incrementally ingesting data from cloud storage

C. df.write.format('delta').save('path')

D. JSON

Answer: D

Q: Which function applies transformation to each row?

A. JSON

B. Structured Streaming

C. Databricks Workflows

D. map

Answer: D

Q: Which format is NOT typically used in Databricks ingestion?

A. map

B. XLS

C. spark.read.csv('file.csv')

D. dropna

Answer: B

Q: How do you write a DataFrame as Delta?

A. Structured Streaming

B. Incrementally ingesting data from cloud storage

C. JSON

D. df.write.format('delta').save('path')

Answer: D

Q: How to read CSV data into a DataFrame?

A. JSON
Databricks Certified Data Engineer Associate - Practice Questions

B. df.write.format('delta').save('path')

C. Structured Streaming

D. spark.read.csv('file.csv')

Answer: D

Q: Which method is used for cleaning data?

A. Structured Streaming

B. JSON

C. df.write.format('delta').save('path')

D. dropna

Answer: D

Q: Which method ingests streaming data?

A. JSON

B. Structured Streaming

C. readStream

D. dropna

Answer: C

Q: What is 'autoloader' used for?

A. JSON

B. spark.read.csv('file.csv')

C. df.write.format('delta').save('path')

D. Incrementally ingesting data from cloud storage

Answer: D

Q: Which API supports streaming in Spark?

A. dropna

B. JSON

C. Structured Streaming

D. map

Answer: C

Databricks Lakehouse Platform

Q: Which storage format does Lakehouse architecture commonly use?

A. Unified BI and ML analytics

Databricks Certified Data Engineer Associate - Practice Questions

B. Lack of schema enforcement and consistency

C. Open formats and APIs

D. Delta Lake

Answer: D

Q: How does Lakehouse support ML workloads?

A. By enabling data scientists to access the same data used in analytics

B. ACID transactions

C. Unified BI and ML analytics

D. Open formats and APIs

Answer: A

Q: What is one way Lakehouse reduces data movement?

A. It combines the benefits of data lakes and data warehouses

B. Unified data platform

C. Unified BI and ML analytics

D. By enabling data scientists to access the same data used in analytics

Answer: B

Q: Which layer of Lakehouse handles governance and security?

A. Open formats and APIs

B. Metadata layer

C. By enabling data scientists to access the same data used in analytics

D. ACID transactions

Answer: B

Q: Which component enables data reliability in a Lakehouse?

A. Unified data platform

B. Lack of schema enforcement and consistency

C. It combines the benefits of data lakes and data warehouses

D. ACID transactions

Answer: D

Q: What is a common use case of a Lakehouse?

A. Unified BI and ML analytics

B. ACID transactions
Databricks Certified Data Engineer Associate - Practice Questions

C. Batch and streaming workloads

D. Unified data platform

Answer: A

Q: Why are traditional data lakes insufficient for BI workloads?

A. Batch and streaming workloads

B. Lack of schema enforcement and consistency

C. Metadata layer

D. Open formats and APIs

Answer: B

Q: Which feature allows multiple tools to access the same data in Lakehouse?

A. Open formats and APIs

B. Delta Lake

C. Metadata layer

D. It combines the benefits of data lakes and data warehouses

Answer: A

Q: What is the primary benefit of the Databricks Lakehouse Platform?

A. Open formats and APIs

B. By enabling data scientists to access the same data used in analytics

C. Batch and streaming workloads

D. It combines the benefits of data lakes and data warehouses

Answer: D

Q: What type of data workloads can be handled by a Lakehouse?

A. It combines the benefits of data lakes and data warehouses

B. Open formats and APIs

C. Delta Lake

D. Batch and streaming workloads

Answer: D

Delta Lake

Q: Which method updates a Delta table conditionally?

A. Parquet

B. MERGE INTO
Databricks Certified Data Engineer Associate - Practice Questions

C. Data reliability with ACID transactions

D. _delta_log

Answer: B

Q: How can schema evolution be enabled in Delta?

A. RESTORE

B. A table stored in Delta format with transaction support

C. Transaction log

D. mergeSchema=True

Answer: D

Q: What is a Delta table?

A. Transaction log

B. Parquet

C. Data reliability with ACID transactions

D. A table stored in Delta format with transaction support

Answer: D

Q: How to enable change data feed in Delta Lake?

A. VACUUM

B. Transaction log

C. Set 'delta.enableChangeDataFeed = true'

D. RESTORE

Answer: C

Q: Which command is used to remove old files in Delta tables?

A. Parquet

B. RESTORE

C. A table stored in Delta format with transaction support

D. VACUUM

Answer: D

Q: What does Delta Lake use for ACID transactions?

A. VACUUM

B. Data reliability with ACID transactions

C. _delta_log
Databricks Certified Data Engineer Associate - Practice Questions

D. A table stored in Delta format with transaction support

Answer: C

Q: What operation allows restoring a table to a previous state?

A. Transaction log

B. RESTORE

C. mergeSchema=True

D. Set 'delta.enableChangeDataFeed = true'

Answer: B

Q: What is one benefit of Delta Lake?

A. Set 'delta.enableChangeDataFeed = true'

B. VACUUM

C. A table stored in Delta format with transaction support

D. Data reliability with ACID transactions

Answer: D

Q: Which file format is used by Delta Lake?

A. VACUUM

B. Set 'delta.enableChangeDataFeed = true'

C. Transaction log

D. Parquet

Answer: D

Q: What enables time travel in Delta Lake?

A. A table stored in Delta format with transaction support

B. Transaction log

C. VACUUM

D. RESTORE

Answer: B

ETL Pipelines & Workflows

Q: What is a task in Databricks Jobs?

A. Via Widgets or Job Parameters

B. A unit of work like running a notebook or script

C. Single Node
Databricks Certified Data Engineer Associate - Practice Questions

D. Python task

Answer: B

Q: How are job parameters passed?

A. Governance on cluster configurations

B. Jobs UI

C. Via Widgets or Job Parameters

D. max_retries

Answer: C

Q: What is a multi-task job?

A. Workflow with multiple dependent tasks

B. Jobs UI

C. Single Node

D. Use the cron expression

Answer: A

Q: What parameter controls retry attempts?

A. max_retries

B. Via Widgets or Job Parameters

C. Use the cron expression

D. Job run history page

Answer: A

Q: How to schedule a job weekly?

A. Workflow with multiple dependent tasks

B. Via Widgets or Job Parameters

C. Python task

D. Use the cron expression

Answer: D

Q: Which task type supports Python scripts?

A. Python task

B. A unit of work like running a notebook or script

C. Governance on cluster configurations

D. max_retries
Databricks Certified Data Engineer Associate - Practice Questions

Answer: A

Q: What is the default cluster mode in a job?

A. Single Node

B. max_retries

C. Jobs UI

D. Job run history page

Answer: A

Q: Where do you find job run logs?

A. Jobs UI

B. max_retries

C. Governance on cluster configurations

D. Job run history page

Answer: D

Q: What is a cluster policy?

A. Via Widgets or Job Parameters

B. Governance on cluster configurations

C. Use the cron expression

D. Single Node

Answer: B

Q: What UI is used to create workflows in Databricks?

A. Via Widgets or Job Parameters

B. Single Node

C. Jobs UI

D. Workflow with multiple dependent tasks

Answer: C

DEA - JULY2024-NoCopy
No ratings yet
DEA - JULY2024-NoCopy
94 pages
Databricks Questions
No ratings yet
Databricks Questions
31 pages
Certified Data Engineer Professional Questions Answers Only
100% (1)
Certified Data Engineer Professional Questions Answers Only
96 pages
Databricks Data Engineer Professional
No ratings yet
Databricks Data Engineer Professional
98 pages
Databricks Certified Professional Data Engineer 1 1
No ratings yet
Databricks Certified Professional Data Engineer 1 1
16 pages
Systemverilog For Design and Verification: Engineer Explorer Series
100% (2)
Systemverilog For Design and Verification: Engineer Explorer Series
486 pages
Databricks Associate Data Engineer Notes
No ratings yet
Databricks Associate Data Engineer Notes
39 pages
Natural Health and Healing
100% (4)
Natural Health and Healing
184 pages
Natural Health and Healing
100% (4)
Natural Health and Healing
184 pages
What is a diaspora - Kevin Kenny
No ratings yet
What is a diaspora - Kevin Kenny
14 pages
Modern Maths Questions
100% (3)
Modern Maths Questions
11 pages
Databricks Certified Associate Data Engineer
100% (1)
Databricks Certified Associate Data Engineer
18 pages
Databricks Certified Data Analyst Associate Exam Dumps
No ratings yet
Databricks Certified Data Analyst Associate Exam Dumps
7 pages
Valence
100% (1)
Valence
241 pages
Hs2 Main Report
No ratings yet
Hs2 Main Report
252 pages
databricks-certified-data-engineer-associate_6
No ratings yet
databricks-certified-data-engineer-associate_6
10 pages
Databricks_Data_Engineer_Professional_Practice
No ratings yet
Databricks_Data_Engineer_Professional_Practice
10 pages
Databricks Certified Data Engineer Associate 9
No ratings yet
Databricks Certified Data Engineer Associate 9
12 pages
DCP Examen
100% (1)
DCP Examen
112 pages
Data PDF
No ratings yet
Data PDF
48 pages
Instant Download Abstract Dynamic Programming Second Edition Dimitri P. Bertsekas PDF All Chapter
100% (3)
Instant Download Abstract Dynamic Programming Second Edition Dimitri P. Bertsekas PDF All Chapter
62 pages
STAAR Test - Reading
0% (1)
STAAR Test - Reading
9 pages
Percussive Typhoon: Walter Mertens
No ratings yet
Percussive Typhoon: Walter Mertens
35 pages
Introduction To E-Models: Emarketing Excellence by Dave Chaffey and PR Smith
No ratings yet
Introduction To E-Models: Emarketing Excellence by Dave Chaffey and PR Smith
35 pages
Data Bricks
No ratings yet
Data Bricks
20 pages
Databricks Certified Data Analyst Associate (1)
No ratings yet
Databricks Certified Data Analyst Associate (1)
110 pages
Living Language Hindi A Complete Course For Beginners
100% (8)
Living Language Hindi A Complete Course For Beginners
177 pages
2014 Texas Staar Test - End of Course - English Ii
No ratings yet
2014 Texas Staar Test - End of Course - English Ii
70 pages
2014 Texas Staar Test - End of Course - English I
No ratings yet
2014 Texas Staar Test - End of Course - English I
69 pages
ComfortClass 400
No ratings yet
ComfortClass 400
24 pages
Cassandra Spark Integration
No ratings yet
Cassandra Spark Integration
28 pages
Strand Corrosion Click Here 1
No ratings yet
Strand Corrosion Click Here 1
9 pages
Floorings: Unit - Iv
100% (1)
Floorings: Unit - Iv
22 pages
Pse Anrpt2010
No ratings yet
Pse Anrpt2010
59 pages
PracticeExam DataEngineerAssociate
No ratings yet
PracticeExam DataEngineerAssociate
23 pages
Databricks Certified Data Engineer Associate Practice Exams - 1
No ratings yet
Databricks Certified Data Engineer Associate Practice Exams - 1
25 pages
Arts Scopeand Sequence
No ratings yet
Arts Scopeand Sequence
17 pages
azure comapny wise question
No ratings yet
azure comapny wise question
68 pages
Databricks Final
100% (1)
Databricks Final
81 pages
DBT Interview
No ratings yet
DBT Interview
7 pages
Cost, Time and Quality, Two Best Guesses and A Phenomenon, Its Time To Accept Other Success Criteria
100% (2)
Cost, Time and Quality, Two Best Guesses and A Phenomenon, Its Time To Accept Other Success Criteria
6 pages
Colonialism
No ratings yet
Colonialism
7 pages
DBT Interview Questions
No ratings yet
DBT Interview Questions
18 pages
M Co Quota 120216
No ratings yet
M Co Quota 120216
47 pages
Timetable Report - Final
No ratings yet
Timetable Report - Final
7 pages
Error Codes Swingo 4000
No ratings yet
Error Codes Swingo 4000
4 pages
Discussion: Exercise
No ratings yet
Discussion: Exercise
10 pages
NHD Bibliograph1
No ratings yet
NHD Bibliograph1
6 pages
Certified Data Engineer Associate
No ratings yet
Certified Data Engineer Associate
24 pages
Snowproans
No ratings yet
Snowproans
85 pages
Ps Module 5 2nd Sem 2nd Quarter Grade 11 Abm Rizal Humss Bonifacioagoncillo Mr. Arnold Paombong
No ratings yet
Ps Module 5 2nd Sem 2nd Quarter Grade 11 Abm Rizal Humss Bonifacioagoncillo Mr. Arnold Paombong
9 pages
Informatica - Commands - PMCMD
No ratings yet
Informatica - Commands - PMCMD
3 pages
Databricks Questions
No ratings yet
Databricks Questions
23 pages
Cursos Parte 1
No ratings yet
Cursos Parte 1
4 pages
Claricel Mae C. Baetiong: (Career Objective) (Skills and Qualifications)
No ratings yet
Claricel Mae C. Baetiong: (Career Objective) (Skills and Qualifications)
1 page
Databricks Interview Question & Answers
No ratings yet
Databricks Interview Question & Answers
10 pages
Databricks Certified Data Engineer Associate 4
100% (1)
Databricks Certified Data Engineer Associate 4
13 pages
Non Aligned Movement Upsc Notes 48
No ratings yet
Non Aligned Movement Upsc Notes 48
3 pages
TQM Exemplary Organization - Jojie de Ramos
No ratings yet
TQM Exemplary Organization - Jojie de Ramos
2 pages
06-Setting Up Unity Catalog
No ratings yet
06-Setting Up Unity Catalog
5 pages
Databricks Certified Professional Data Engineer Questions and Answers PDF Dumps
No ratings yet
Databricks Certified Professional Data Engineer Questions and Answers PDF Dumps
6 pages
Databricks Certified Data Engineer Associate PDF
0% (1)
Databricks Certified Data Engineer Associate PDF
5 pages
HDPE Pipe and Fittings - 201207191627029471
No ratings yet
HDPE Pipe and Fittings - 201207191627029471
12 pages
7 KAMBI
No ratings yet
7 KAMBI
2 pages
DATABRICKS DATA ENGG PRO CERTIFICATION DUMPS
100% (2)
DATABRICKS DATA ENGG PRO CERTIFICATION DUMPS
41 pages
Course Certificate Instructuons
No ratings yet
Course Certificate Instructuons
1 page
Manage Data Access With Unity Catalog
No ratings yet
Manage Data Access With Unity Catalog
17 pages
Snowflake To Oracle
No ratings yet
Snowflake To Oracle
16 pages
Data Engineer Certification Questions1
100% (1)
Data Engineer Certification Questions1
22 pages
NG Sze Kay Priscilla 1
No ratings yet
NG Sze Kay Priscilla 1
1 page
IDQ Reference
No ratings yet
IDQ Reference
31 pages
Top 50 Data Warehousing Interview Questions & Answers
No ratings yet
Top 50 Data Warehousing Interview Questions & Answers
8 pages
Quemuel vs. CA (Digest)
No ratings yet
Quemuel vs. CA (Digest)
1 page
SCD Type 2. Pyspark
No ratings yet
SCD Type 2. Pyspark
7 pages
Recipe of Tandoori Chicken
No ratings yet
Recipe of Tandoori Chicken
1 page
Informatica - Commands - PMCMD
No ratings yet
Informatica - Commands - PMCMD
2 pages
Informatica - Commands - PMCMD
No ratings yet
Informatica - Commands - PMCMD
2 pages
ABD22 1st Exam - 6 January - Attempt Review
No ratings yet
ABD22 1st Exam - 6 January - Attempt Review
13 pages
Unity Catalog
No ratings yet
Unity Catalog
16 pages
ADB Course Catalog
No ratings yet
ADB Course Catalog
84 pages
azure DE interview que
100% (1)
azure DE interview que
25 pages
Interview DE by Company Azurelib Dot Com
No ratings yet
Interview DE by Company Azurelib Dot Com
14 pages
Interview Questions On ADF
No ratings yet
Interview Questions On ADF
2 pages
Databricksmcqsquestionsandanswers
No ratings yet
Databricksmcqsquestionsandanswers
5 pages
INTERVIEW QUESTIONS - ALL Companies
No ratings yet
INTERVIEW QUESTIONS - ALL Companies
15 pages
Databricks
No ratings yet
Databricks
11 pages
Azure DataEngineering End To End Videos
No ratings yet
Azure DataEngineering End To End Videos
21 pages
Pushpender Snowflake 24thjune Questions
No ratings yet
Pushpender Snowflake 24thjune Questions
3 pages
DataEngineer Roadmap
No ratings yet
DataEngineer Roadmap
12 pages
Databricks Delta Guide
No ratings yet
Databricks Delta Guide
11 pages
Spark Interview Q&A
No ratings yet
Spark Interview Q&A
31 pages
Databricks Course Curriculum
No ratings yet
Databricks Course Curriculum
2 pages
Databricks Question
No ratings yet
Databricks Question
89 pages
L02 - Spark SQL For Data Processing: CBG1C04 Big Data Programming
No ratings yet
L02 - Spark SQL For Data Processing: CBG1C04 Big Data Programming
23 pages
Pyspark MCQ
No ratings yet
Pyspark MCQ
3 pages
Databricks Certified Data Engineer Associate Exam Guide
No ratings yet
Databricks Certified Data Engineer Associate Exam Guide
7 pages
Datastage Questions
No ratings yet
Datastage Questions
18 pages
BD - Spark - Baladasu A - SightSpectrum
No ratings yet
BD - Spark - Baladasu A - SightSpectrum
3 pages
4.1 The Spark UI - Databricks
No ratings yet
4.1 The Spark UI - Databricks
7 pages
Spark Use Cases
No ratings yet
Spark Use Cases
2 pages
Microsoft Certified: Azure Data Engineer Associate - Skills Measured
No ratings yet
Microsoft Certified: Azure Data Engineer Associate - Skills Measured
4 pages
Couchbase Certified Java Developer - Exam Practice Tests
From Everand
Couchbase Certified Java Developer - Exam Practice Tests
Cristian Scutaru
No ratings yet

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.