0% found this document useful (0 votes)

16 views

Pandas_Interview_Questions_PowerBI_SQL

The document presents a series of Pandas interview questions with real-time scenarios relevant to Power BI and SQL. Each scenario includes a question and a corresponding code solution using Pandas for tasks such as data preprocessing, SQL query replication, dataset merging, time intelligence calculations, and handling large datasets. It also covers automating data transformation from Excel to SQL, demonstrating practical applications of Pandas in data analysis and manipulation.

Uploaded by

verma.anil0509

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

16 views

Pandas_Interview_Questions_PowerBI_SQL

Uploaded by

verma.anil0509

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 3

Pandas Interview Questions with Real-time Scenarios for Power BI and SQL

1. Scenario: Data Preprocessing before Power BI Import

Q: You're working with a CSV dataset that contains sales data. Some rows have missing values in the ProductName

and Revenue columns. Before importing into Power BI, how would you handle this using Pandas?

import pandas as pd

df = pd.read_csv('sales.csv')

df = df[df['ProductName'].notna()]

df['Revenue'] = df['Revenue'].fillna(0)

2. Scenario: SQL to Pandas Conversion

Q: You have this SQL query:

SELECT Region, SUM(SalesAmount) FROM Sales GROUP BY Region HAVING SUM(SalesAmount) > 10000

How would you replicate it in Pandas?

df_grouped = df.groupby('Region')['SalesAmount'].sum().reset_index()

df_filtered = df_grouped[df_grouped['SalesAmount'] > 10000]

3. Scenario: Merging Datasets like SQL Joins

Q: You have two dataframes: orders and customers. How would you perform a LEFT JOIN in Pandas?

df_joined = pd.merge(orders, customers, how='left', on='CustomerID')

4. Scenario: Time Intelligence like DAX

Q: How would you calculate YoY Sales using Pandas?

df['OrderDate'] = pd.to_datetime(df['OrderDate'])

df['Year'] = df['OrderDate'].dt.year

df['Month'] = df['OrderDate'].dt.month

monthly_sales = df.groupby(['Year', 'Month'])['Sales'].sum().reset_index()

monthly_sales['Sales_PY'] = monthly_sales['Sales'].shift(12)

monthly_sales['YoY_Growth'] = ((monthly_sales['Sales'] - monthly_sales['Sales_PY']) / monthly_sales['Sales_PY']) * 100

5. Scenario: Handling Large Datasets like Fact Tables

Q: You have a large dataset (10 million rows) in CSV format. What Pandas techniques would you use?

chunks = pd.read_csv('large_sales.csv', chunksize=500000)

filtered_chunks = []

for chunk in chunks:

chunk = chunk[chunk['Sales'] > 1000]

filtered_chunks.append(chunk)

df_filtered = pd.concat(filtered_chunks)

6. Scenario: Replace Calculated Columns in Power BI with Pandas

Q: How would you calculate Profit Margin?

df['ProfitMargin'] = (df['Revenue'] - df['Cost']) / df['Revenue']

7. Scenario: Automating Excel/CSV to Power BI Pipeline

Q: How would you clean and transform data from Excel sheets and push to SQL?

all_sheets = pd.read_excel('sales_data.xlsx', sheet_name=None)

combined = pd.concat(all_sheets.values(), ignore_index=True)

combined['Revenue'] = combined['Revenue'].fillna(0)

combined['Date'] = pd.to_datetime(combined['Date'])

from sqlalchemy import create_engine

engine = create_engine('mssql+pyodbc://server/db?driver=SQL+Server')

combined.to_sql('SalesCleaned', con=engine, if_exists='replace')

Data Cleaning - Cheatsheet
100% (2)
Data Cleaning - Cheatsheet
8 pages
Swift User Guide
100% (1)
Swift User Guide
48 pages
NumPy_Interview_Questions_PowerBI_SQL
No ratings yet
NumPy_Interview_Questions_PowerBI_SQL
3 pages
recently asked Data Analyst interview questions
No ratings yet
recently asked Data Analyst interview questions
4 pages
S
No ratings yet
S
22 pages
SQL Python PowerBI Questions and Answers
No ratings yet
SQL Python PowerBI Questions and Answers
4 pages
Python_Questions__BA
No ratings yet
Python_Questions__BA
5 pages
Pandas Roadmap
No ratings yet
Pandas Roadmap
6 pages
DevOps Session 3 Pandas.pptx
No ratings yet
DevOps Session 3 Pandas.pptx
33 pages
1742275703376
No ratings yet
1742275703376
3 pages
Python Interview Questions For Data Analytics
No ratings yet
Python Interview Questions For Data Analytics
2 pages
Python Interview Questions by Skill Arbitrage
No ratings yet
Python Interview Questions by Skill Arbitrage
3 pages
Recently Asked Data Analyst interview questions-2
No ratings yet
Recently Asked Data Analyst interview questions-2
4 pages
Walmart Data Analyst Interview Experience
No ratings yet
Walmart Data Analyst Interview Experience
10 pages
a5
No ratings yet
a5
28 pages
Pandas
No ratings yet
Pandas
26 pages
lab 1 ML lab
No ratings yet
lab 1 ML lab
15 pages
python interviews
No ratings yet
python interviews
154 pages
Pandas_Tutorial
No ratings yet
Pandas_Tutorial
9 pages
MCQ
No ratings yet
MCQ
8 pages
PRACTICAL FILE INFOMATICS PRACTICES 2024-25
No ratings yet
PRACTICAL FILE INFOMATICS PRACTICES 2024-25
39 pages
Dataframe in Pandas - Cheatsheet
No ratings yet
Dataframe in Pandas - Cheatsheet
8 pages
Python - Pandas_Numpy Interview Q&A
No ratings yet
Python - Pandas_Numpy Interview Q&A
12 pages
prac1
No ratings yet
prac1
5 pages
Python MCQs
No ratings yet
Python MCQs
21 pages
pandas_notes
No ratings yet
pandas_notes
8 pages
Python Pandas
No ratings yet
Python Pandas
15 pages
Questions_For_Preparation (1)
No ratings yet
Questions_For_Preparation (1)
9 pages
EDA with Pandas
No ratings yet
EDA with Pandas
8 pages
Module_4
No ratings yet
Module_4
38 pages
Data Wrangling With Python and Pandas
No ratings yet
Data Wrangling With Python and Pandas
7 pages
UNIT II 2M
No ratings yet
UNIT II 2M
8 pages
Pandas Fuction Notes
No ratings yet
Pandas Fuction Notes
3 pages
Python Pandas Tutorial For Beginners
No ratings yet
Python Pandas Tutorial For Beginners
203 pages
Mastering Data Analyst Interview Scenarios
No ratings yet
Mastering Data Analyst Interview Scenarios
20 pages
Day 3 - Notes Interview Questions
No ratings yet
Day 3 - Notes Interview Questions
36 pages
What is pandas
No ratings yet
What is pandas
9 pages
CO3_3_Indexing and Sorting, Loading Data From CSV
No ratings yet
CO3_3_Indexing and Sorting, Loading Data From CSV
29 pages
Loki Temp PPT Pandas 2
No ratings yet
Loki Temp PPT Pandas 2
31 pages
Python Pandas Tutorial_ the Ultimate Guide for Beginner
No ratings yet
Python Pandas Tutorial_ the Ultimate Guide for Beginner
32 pages
Pandas_Notes
No ratings yet
Pandas_Notes
6 pages
Pandas Tutorial
No ratings yet
Pandas Tutorial
1 page
Python Data Science 101
100% (1)
Python Data Science 101
41 pages
Document (4)-1
No ratings yet
Document (4)-1
15 pages
text 3
No ratings yet
text 3
3 pages
Pandas Cheat Sheet
No ratings yet
Pandas Cheat Sheet
5 pages
ProductionMGmt XII IP ProjectReprotFinal
No ratings yet
ProductionMGmt XII IP ProjectReprotFinal
16 pages
Top 100 Data Analyst Questions 1 to 60
No ratings yet
Top 100 Data Analyst Questions 1 to 60
14 pages
Pandas
No ratings yet
Pandas
13 pages
L6 and 7-Data Preprocessing-coding
No ratings yet
L6 and 7-Data Preprocessing-coding
34 pages
nRQgi8EgDUNFS451K4xQXA
No ratings yet
nRQgi8EgDUNFS451K4xQXA
61 pages
100 Python Interview Questions
No ratings yet
100 Python Interview Questions
68 pages
ANL252 SU4 Jul2022
No ratings yet
ANL252 SU4 Jul2022
55 pages
Exploratory Data Analysis (Eda) With Pandas: (Cheatsheet)
No ratings yet
Exploratory Data Analysis (Eda) With Pandas: (Cheatsheet)
7 pages
SalesMgmtSystem XII IP Projectreport 2022 23
No ratings yet
SalesMgmtSystem XII IP Projectreport 2022 23
18 pages
Intro Pandas
No ratings yet
Intro Pandas
18 pages
Rajendra Reddy Task-1
No ratings yet
Rajendra Reddy Task-1
9 pages
Data Manipulation in Python Using Pandas
No ratings yet
Data Manipulation in Python Using Pandas
12 pages
Microsoft Azure Database Administrator DP 300
From Everand
Microsoft Azure Database Administrator DP 300
Manish Soni
No ratings yet
Administering Microsoft Azure SQL Solutions DP 300
From Everand
Administering Microsoft Azure SQL Solutions DP 300
Manish Soni
No ratings yet
100 Puzzles to Learn Data Warehousing
From Everand
100 Puzzles to Learn Data Warehousing
Cristian Scutaru
No ratings yet
INTERNSHIP REPORT OF KHYBER BANK
No ratings yet
INTERNSHIP REPORT OF KHYBER BANK
59 pages
Bebras Solutions Guide 2023 R2 Secondary
No ratings yet
Bebras Solutions Guide 2023 R2 Secondary
108 pages
Section 7 Quiz
100% (1)
Section 7 Quiz
7 pages
Proposal Dsa 140,155,170
No ratings yet
Proposal Dsa 140,155,170
4 pages
Smits 和 Wevers - 2023 - A multimodal turn in Digital Humanities. Using con
No ratings yet
Smits 和 Wevers - 2023 - A multimodal turn in Digital Humanities. Using con
14 pages
dbms revaan final
No ratings yet
dbms revaan final
77 pages
Final Project Plan Outline
No ratings yet
Final Project Plan Outline
4 pages
8086 Cpu
No ratings yet
8086 Cpu
89 pages
S.A.P SG-7002-R
No ratings yet
S.A.P SG-7002-R
11 pages
Compression For File
No ratings yet
Compression For File
18 pages
Thesis About Failing Grades
100% (3)
Thesis About Failing Grades
7 pages
21bce9836 DBMS Lab Assignment-1
No ratings yet
21bce9836 DBMS Lab Assignment-1
7 pages
Database Management Systems-14
No ratings yet
Database Management Systems-14
10 pages
MIS Unit 3
No ratings yet
MIS Unit 3
39 pages
BPS Assessment Centre Guidelines
100% (1)
BPS Assessment Centre Guidelines
25 pages
G12 SLM1 PR2 Q3 Module 1 - V2 Final1 2
No ratings yet
G12 SLM1 PR2 Q3 Module 1 - V2 Final1 2
4 pages
Evaluation of The Dalcroze Rhythmic Approach in First Steps of Music Education
No ratings yet
Evaluation of The Dalcroze Rhythmic Approach in First Steps of Music Education
6 pages
K012654 Question To Insight 1
No ratings yet
K012654 Question To Insight 1
10 pages
Adcrdb TEST
No ratings yet
Adcrdb TEST
3 pages
AWS Certified Database Specialty - Sample Questions - v1.1
100% (1)
AWS Certified Database Specialty - Sample Questions - v1.1
5 pages
RFID Telematics Folder EN
No ratings yet
RFID Telematics Folder EN
16 pages
Ibutton Tmex
No ratings yet
Ibutton Tmex
67 pages
Test Final Exam Sem 2 Part2
No ratings yet
Test Final Exam Sem 2 Part2
17 pages
Library System Thesis Proposal
100% (3)
Library System Thesis Proposal
6 pages
Deepashree Resume
No ratings yet
Deepashree Resume
2 pages
Ujian Golang Intermediate
No ratings yet
Ujian Golang Intermediate
20 pages
sdm
No ratings yet
sdm
77 pages
710 - Archive Server 9.7.0 Administration
No ratings yet
710 - Archive Server 9.7.0 Administration
426 pages
Nursing Process in The Care of Population Groups and Community
No ratings yet
Nursing Process in The Care of Population Groups and Community
7 pages

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.

Pandas_Interview_Questions_PowerBI_SQL

Uploaded by

Pandas_Interview_Questions_PowerBI_SQL

Uploaded by

Pandas Interview Questions with Real-time Scenarios for Power BI and SQL

1. Scenario: Data Preprocessing before Power BI Import

2. Scenario: SQL to Pandas Conversion

Q: You have this SQL query:

How would you replicate it in Pandas?

df_filtered = df_grouped[df_grouped['SalesAmount'] > 10000]

3. Scenario: Merging Datasets like SQL Joins

df_joined = pd.merge(orders, customers, how='left', on='CustomerID')

4. Scenario: Time Intelligence like DAX

Q: How would you calculate YoY Sales using Pandas?

monthly_sales = df.groupby(['Year', 'Month'])['Sales'].sum().reset_index()

monthly_sales['YoY_Growth'] = ((monthly_sales['Sales'] - monthly_sales['Sales_PY']) / monthly_sales['Sales_PY']) * 100

5. Scenario: Handling Large Datasets like Fact Tables

chunks = pd.read_csv('large_sales.csv', chunksize=500000)

for chunk in chunks:

chunk = chunk[chunk['Sales'] > 1000]

6. Scenario: Replace Calculated Columns in Power BI with Pandas

Q: How would you calculate Profit Margin?

df['ProfitMargin'] = (df['Revenue'] - df['Cost']) / df['Revenue']

7. Scenario: Automating Excel/CSV to Power BI Pipeline

all_sheets = pd.read_excel('sales_data.xlsx', sheet_name=None)

from sqlalchemy import create_engine

combined.to_sql('SalesCleaned', con=engine, if_exists='replace')

You might also like

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.