0% found this document useful (0 votes)

4 views2 pages

Practical1c.ipynb - Colab

The document outlines a data processing workflow using Python libraries, including pandas and scikit-learn, to manipulate a sample dataset with categorical and numerical variables. It demonstrates label encoding, min-max scaling, standard scaling, and binarization of the data. Finally, the processed dataset is saved as a CSV file named 'processed_data.csv'.

Uploaded by

Tania Jamdar

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

4 views2 pages

Practical1c.ipynb - Colab

Uploaded by

Tania Jamdar

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 2

11/30/24, 3:34 PM Practical1c.

ipynb - Colab

# Import required libraries

import pandas as pd
import numpy as np
from sklearn.preprocessing import LabelEncoder, MinMaxScaler, StandardScaler, Binarizer

# Create a sample dataset

data = pd.DataFrame({
'Category': ['A', 'B', 'C', 'A', 'B', 'C'], # Categorical variable
'Age': [23, 45, 31, 22, 35, 30], # Numerical variable
'Income': [50000, 60000, 70000, 80000, 90000, 100000], # Numerical variable
'Has_Car': ['Yes', 'No', 'Yes', 'No', 'Yes', 'No'] # Binary categorical variable
})
# Display the dataset
print("Sample Dataset:")
print(data)

Sample Dataset:
Category Age Income Has_Car
0 A 23 50000 Yes
1 B 45 60000 No
2 C 31 70000 Yes
3 A 22 80000 No
4 B 35 90000 Yes
5 C 30 100000 No

# Label Encoding for 'Category' column

label_encoder = LabelEncoder()
data['Category_Encoded'] = label_encoder.fit_transform(data['Category'])
# Label Encoding for binary column 'Has_Car'
data['Has_Car_Encoded'] = label_encoder.fit_transform(data['Has_Car'])
print("\nAfter Label Encoding:")
print(data)

After Label Encoding:

Category Age Income Has_Car Category_Encoded Has_Car_Encoded
0 A 23 50000 Yes 0 1
1 B 45 60000 No 1 0
2 C 31 70000 Yes 2 1
3 A 22 80000 No 0 0
4 B 35 90000 Yes 1 1
5 C 30 100000 No 2 0

# Min-Max Scaling for 'Income'

min_max_scaler = MinMaxScaler()
data['Income_MinMax'] = min_max_scaler.fit_transform(data[['Income']])
# Standard Scaling for 'Age'
standard_scaler = StandardScaler()
data['Age_Standardized'] = standard_scaler.fit_transform(data[['Age']])
print("\nAfter Scaling:")
print(data)

After Scaling:
Category Age Income Has_Car Category_Encoded Has_Car_Encoded \
0 A 23 50000 Yes 0 1
1 B 45 60000 No 1 0
2 C 31 70000 Yes 2 1
3 A 22 80000 No 0 0
4 B 35 90000 Yes 1 1
5 C 30 100000 No 2 0

Income_MinMax Age_Standardized
0 0.0 -1.035676
1 0.2 1.812434
2 0.4 0.000000
3 0.6 -1.165136
4 0.8 0.517838
5 1.0 -0.129460

# Binarization for 'Income' with a threshold of 75,000

binarizer = Binarizer(threshold=75000)
data['Income_Binary'] = binarizer.fit_transform(data[['Income']])
print("\nAfter Binarization:")
print(data)

After Binarization:
Category Age Income Has_Car Category_Encoded Has_Car_Encoded \
0 A 23 50000 Yes 0 1
1 B 45 60000 No 1 0

https://colab.research.google.com/drive/1vzCv7xFKj-Mru4D-MXvHU496haU-bL0I#scrollTo=8V8mxZ5Uhops&printMode=true 1/2
11/30/24, 3:34 PM Practical1c.ipynb - Colab
2 C 31 70000 Yes 2 1
3 A 22 80000 No 0 0
4 B 35 90000 Yes 1 1
5 C 30 100000 No 2 0

Income_MinMax Age_Standardized Income_Binary

0 0.0 -1.035676 0
1 0.2 1.812434 0
2 0.4 0.000000 0
3 0.6 -1.165136 1
4 0.8 0.517838 1
5 1.0 -0.129460 1

# Save the processed dataset

data.to_csv('processed_data.csv', index=False)
print("\nProcessed dataset saved as 'processed_data.csv'")

Processed dataset saved as 'processed_data.csv'

https://colab.research.google.com/drive/1vzCv7xFKj-Mru4D-MXvHU496haU-bL0I#scrollTo=8V8mxZ5Uhops&printMode=true 2/2

Untitled
No ratings yet
Untitled
1,326 pages
Lambda Functions & Alternative Methods in Python
No ratings yet
Lambda Functions & Alternative Methods in Python
8 pages
Germany Credit Analysis
No ratings yet
Germany Credit Analysis
41 pages
Machine Learning Record VR19
No ratings yet
Machine Learning Record VR19
46 pages
Mathallcodes 1
No ratings yet
Mathallcodes 1
32 pages
Develop A Program To Implement Data Preprocessing Using
No ratings yet
Develop A Program To Implement Data Preprocessing Using
19 pages
Note 4
No ratings yet
Note 4
18 pages
DM Lab Progrmas 35
No ratings yet
DM Lab Progrmas 35
38 pages
Panda Merged
No ratings yet
Panda Merged
19 pages
Abhiml ML File
No ratings yet
Abhiml ML File
74 pages
Machine Learning Program
No ratings yet
Machine Learning Program
12 pages
Machine Learning
No ratings yet
Machine Learning
81 pages
Ensemmmmm
No ratings yet
Ensemmmmm
10 pages
Data Science Practical Problems
No ratings yet
Data Science Practical Problems
40 pages
2022UCD2164-1-2
No ratings yet
2022UCD2164-1-2
35 pages
Shipping Company 2
No ratings yet
Shipping Company 2
16 pages
ML LAB - BCSL606
No ratings yet
ML LAB - BCSL606
67 pages
pt1 Answer Oops
No ratings yet
pt1 Answer Oops
8 pages
Esbe GB General Katalog 2013
100% (1)
Esbe GB General Katalog 2013
212 pages
決策樹-R程式練習
No ratings yet
決策樹-R程式練習
11 pages
Predictive_Modelling_Alternate_Project_Business_Case.docx
No ratings yet
Predictive_Modelling_Alternate_Project_Business_Case.docx
47 pages
KNN - Jupyter Notebook (1)
No ratings yet
KNN - Jupyter Notebook (1)
7 pages
決策樹-R程式練習
No ratings yet
決策樹-R程式練習
11 pages
Vertopal.com AML Project LearnerNotebook LowCode
No ratings yet
Vertopal.com AML Project LearnerNotebook LowCode
74 pages
Credit Card Default
No ratings yet
Credit Card Default
5 pages
FeatureEngineering (1)
No ratings yet
FeatureEngineering (1)
50 pages
data analytics lab manual
No ratings yet
data analytics lab manual
26 pages
CALCULATION
No ratings yet
CALCULATION
15 pages
Week 10
No ratings yet
Week 10
50 pages
Openlab1
No ratings yet
Openlab1
17 pages
DAV_practicle_File
No ratings yet
DAV_practicle_File
28 pages
ml lab
No ratings yet
ml lab
23 pages
AIL303 M
No ratings yet
AIL303 M
22 pages
Danmairo - Analysis - Ipynb - Colaboratory
No ratings yet
Danmairo - Analysis - Ipynb - Colaboratory
18 pages
AI Final PDF
No ratings yet
AI Final PDF
38 pages
Name: Dhruvil K Kotecha ID No.: 17CP024 Sub. Code: CP-402 Sub. Name: ADT Semester: 7 Year: 2020/21
No ratings yet
Name: Dhruvil K Kotecha ID No.: 17CP024 Sub. Code: CP-402 Sub. Name: ADT Semester: 7 Year: 2020/21
30 pages
EDP-3[2]
No ratings yet
EDP-3[2]
16 pages
ML Cops
No ratings yet
ML Cops
17 pages
Student Notebook HR Analysis
No ratings yet
Student Notebook HR Analysis
11 pages
Practical 3
No ratings yet
Practical 3
8 pages
Assignment 03
No ratings yet
Assignment 03
6 pages
Project paarth (1) (1)
No ratings yet
Project paarth (1) (1)
21 pages
Assignmnet 5
No ratings yet
Assignmnet 5
11 pages
ML LAB manual-1
No ratings yet
ML LAB manual-1
33 pages
Lab Programmes Adwaith
No ratings yet
Lab Programmes Adwaith
18 pages
Data Preprocessing & Visualization1
No ratings yet
Data Preprocessing & Visualization1
2 pages
Assignment 1 Data Mining
No ratings yet
Assignment 1 Data Mining
1 page
Predictive+Modelling+-+Logistic+Regression+-+Student+Version-New2.3.ipynb - Colaboratory
No ratings yet
Predictive+Modelling+-+Logistic+Regression+-+Student+Version-New2.3.ipynb - Colaboratory
12 pages
CDA PC PeriflexVN 21 EN 0714 1
No ratings yet
CDA PC PeriflexVN 21 EN 0714 1
36 pages
Data Preprocessing 1
No ratings yet
Data Preprocessing 1
6 pages
Updated MES Courses List As On 9 June 2016 With CNN Categorisation - NSQF Levels
100% (1)
Updated MES Courses List As On 9 June 2016 With CNN Categorisation - NSQF Levels
58 pages
Student - Linear Regression Example - Colaboratory
No ratings yet
Student - Linear Regression Example - Colaboratory
6 pages
FYMCA IDSLab A6 Submission
No ratings yet
FYMCA IDSLab A6 Submission
9 pages
Alishba(S005)
No ratings yet
Alishba(S005)
5 pages
Long Addendum Gears 1946
No ratings yet
Long Addendum Gears 1946
15 pages
Lenze E94AYFLF - Digital Frequency Module - v3-2 - EN
No ratings yet
Lenze E94AYFLF - Digital Frequency Module - v3-2 - EN
54 pages
Abhi ML
No ratings yet
Abhi ML
11 pages
AIDS - DM Using Python - Lab Programs
No ratings yet
AIDS - DM Using Python - Lab Programs
19 pages
Aosdijfpqoiew
No ratings yet
Aosdijfpqoiew
6 pages
Training Copy of MCC List - Shortlisted
No ratings yet
Training Copy of MCC List - Shortlisted
80 pages
Abstract:: Design Modification and Analysis of V6 Engine Mounting Bracket
No ratings yet
Abstract:: Design Modification and Analysis of V6 Engine Mounting Bracket
7 pages
EDA - Exploratory Data Analysis
No ratings yet
EDA - Exploratory Data Analysis
16 pages
Running Head: Crown Castle - Environmental Factors. 1
No ratings yet
Running Head: Crown Castle - Environmental Factors. 1
5 pages
Pandas Questions Ip File
No ratings yet
Pandas Questions Ip File
13 pages
Data Mining Lab 03
No ratings yet
Data Mining Lab 03
10 pages
End Sem PYQ
No ratings yet
End Sem PYQ
8 pages
Mid-Sem Model Answer 7
No ratings yet
Mid-Sem Model Answer 7
5 pages
Consultants/Contractors Confirmation Check List: Consultant/Contractor Undertaking
No ratings yet
Consultants/Contractors Confirmation Check List: Consultant/Contractor Undertaking
1 page
Salary Estimation using K-Nearest Neighbour
No ratings yet
Salary Estimation using K-Nearest Neighbour
1 page
WWW - Conotec.co - KR: Model Sensor
No ratings yet
WWW - Conotec.co - KR: Model Sensor
2 pages
FTKF - Leaflet.01 - Tier II Inverter
No ratings yet
FTKF - Leaflet.01 - Tier II Inverter
8 pages
Topcon Rl-Vh4dr GC
No ratings yet
Topcon Rl-Vh4dr GC
2 pages
Querrele Del Film Al Libro
No ratings yet
Querrele Del Film Al Libro
7 pages
OJT Corrigido
No ratings yet
OJT Corrigido
77 pages
ANU Syllabus Mba 1617
No ratings yet
ANU Syllabus Mba 1617
37 pages
Briggs and Stratton 294442
No ratings yet
Briggs and Stratton 294442
29 pages
Kajian Finansial MFOnisasi PLTD Kanaan 06012017
No ratings yet
Kajian Finansial MFOnisasi PLTD Kanaan 06012017
18 pages
Ieee Reference Style
No ratings yet
Ieee Reference Style
5 pages
Zelio Control Relays - RM4TR35
No ratings yet
Zelio Control Relays - RM4TR35
7 pages
Lokfix Mtc
No ratings yet
Lokfix Mtc
2 pages
Radio Tranbsmitter Stokes Part1
No ratings yet
Radio Tranbsmitter Stokes Part1
34 pages
First Name Last Name Username Password
No ratings yet
First Name Last Name Username Password
2 pages
EPB-Sub-01 Epic Residential Condensing Boiler Models Epb080-199
No ratings yet
EPB-Sub-01 Epic Residential Condensing Boiler Models Epb080-199
2 pages
Introduction of Information Age
No ratings yet
Introduction of Information Age
1 page
Compiler Questions
No ratings yet
Compiler Questions
11 pages
15663801595d5d107ff34d6TH ABD Vaijapur
No ratings yet
15663801595d5d107ff34d6TH ABD Vaijapur
1 page
Fairfield by Marriott Belagavi 30-01-2019
No ratings yet
Fairfield by Marriott Belagavi 30-01-2019
4 pages
Separation of Power & IT Cabling
No ratings yet
Separation of Power & IT Cabling
5 pages
Chemical Industries List 02
100% (1)
Chemical Industries List 02
29 pages
Apache Cassandra Administrator Associate - Exam Practice Tests
From Everand
Apache Cassandra Administrator Associate - Exam Practice Tests
Cristian Scutaru
No ratings yet

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.

Practical1c.ipynb - Colab

Uploaded by

Practical1c.ipynb - Colab

Uploaded by

11/30/24, 3:34 PM Practical1c.

# Import required libraries

# Create a sample dataset

# Label Encoding for 'Category' column

After Label Encoding:

# Min-Max Scaling for 'Income'

# Binarization for 'Income' with a threshold of 75,000

Income_MinMax Age_Standardized Income_Binary

# Save the processed dataset

Processed dataset saved as 'processed_data.csv'

You might also like

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.