0% found this document useful (0 votes)

2 views23 pages

Machine learning Lab Assignment 1

The document outlines various machine learning assignments, including Linear Regression, Logistic Regression, Random Forest Classification, Decision Tree, Clustering, and Support Vector Machine (SVM). Each section provides code snippets for data preprocessing, model training, and evaluation using different datasets. Key metrics such as accuracy, mean absolute error, and silhouette score are used to assess model performance.

Uploaded by

tarlanavikas12

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

2 views23 pages

Machine learning Lab Assignment 1

Uploaded by

tarlanavikas12

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 23

ASSIGNMENT

1.Linear Regression
Code:
# Import required libraries
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_absolute_error, mean_squared_error,
r2_score
from sklearn.preprocessing import LabelEncoder, StandardScaler

# Load dataset
data = pd.read_csv('dataset.csv')

# Display basic info

print(data.head())
print(data.info())

# Handle missing values (example: drop rows with missing values)

data = data.dropna()
data = data[data['Production'] != '=']

# Verify the rows are removed

print(data[data['Production'] == '='])

# Encode categorical features

categorical_cols = ['State_Name', 'District_Name', 'Crop', 'Season']
label_encoders = {}
for col in categorical_cols:
le = LabelEncoder()
data[col] = le.fit_transform(data[col])
label_encoders[col] = le

# Define features and target variable

X = data[['Area', 'Season', 'Crop', 'Crop_Year']] # Example features
y = data['Production']
# Split the dataset
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2,
random_state=42)

# Scale the features

scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)
# Train the model
model = LinearRegression()
model.fit(X_train, y_train)

# Predict on test data

y_pred = model.predict(X_test)

# Evaluate the model

mae = mean_absolute_error(y_test, y_pred)
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)
print(f"Mean Absolute Error: {mae}")
print(f"Mean Squared Error: {mse}")
print(f"R-squared: {r2}")
Dataset:

Input:
Output:
2.Logistic Regression
Code:
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score,confusion_matrix
#Read the dataset using pandas (replace 'your_dataset.csv' with your actual file
path)
data = pd.read_csv('studyhours.csv')
print(data)
#Assuming the target column is 'target' and all other coulmnss are features
X = data.drop(columns=['status']) #Drop the target column to get features
y = data['status'] #Target variable
#Split the data into training and testing sets
X_train,X_test,y_train,y_test =
train_test_split(X,y,test_size=0.4,random_state=20)
#Initialize the Logistic Regression model
model = LogisticRegression()
#Train the model
model.fit(X_train,y_train)
#Make predictions on the test data
y_pred = model.predict(X_test)
#Evaluate the model
accuracy = accuracy_score(y_test,y_pred)
conf_matrix = confusion_matrix(y_test,y_pred)
#Print results
print("Accuracy.",accuracy)
print("Confusion Matrix.")
print(conf_matrix)
Dataset:
Input:

Output:
3.Random Forest Classification
Code:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score, confusion_matrix,
classification_report
from sklearn.preprocessing import LabelEncoder
# Load the Titanic dataset
file_path = 'titanic.csv' # Replace with your Titanic dataset file path
data = pd.read_csv(file_path)
# Display the first few rows of the dataset
print("Dataset Preview:")
print(data.head())
# Drop columns not relevant for the model
data = data.drop(['PassengerId', 'Name', 'Ticket', 'Cabin'], axis=1,
errors='ignore')
# Fill missing values
data['Age'].fillna(data['Age'].median(), inplace=True)
data['Embarked'].fillna(data['Embarked'].mode()[0], inplace=True)

# Encode categorical features

categorical_cols = ['Sex', 'Embarked']
label_encoders = {}
for col in categorical_cols:
le = LabelEncoder()
data[col] = le.fit_transform(data[col])
label_encoders[col] = le

# Define features and target variable

X = data.drop(['Survived'], axis=1)
y = data['Survived']

# Split the dataset into training and testing sets

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2,
random_state=42)

# Initialize the Random Forest Classifier

model = RandomForestClassifier(n_estimators=100, random_state=42)
# Train the model
model.fit(X_train, y_train)

# Make predictions
y_pred = model.predict(X_test)

# Evaluate the model

accuracy = accuracy_score(y_test, y_pred)
conf_matrix = confusion_matrix(y_test, y_pred)
class_report = classification_report(y_test, y_pred)

# Display results
print("\nModel Evaluation:")
print(f"Accuracy: {accuracy:.2f}")
print("\nConfusion Matrix:")
print(conf_matrix)
print("\nClassification Report:")
print(class_report)
Dataset:
Input:
Output:
4. Decision Tree id3
Code:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.tree import DecisionTreeClassifier, plot_tree
from sklearn.preprocessing import LabelEncoder
from sklearn.model_selection import train_test_split

# Load the weather dataset

filename = "weather.csv" # Update this path to your CSV file
df = pd.read_csv(filename)
print(df)

# Remove the 'Day' feature if present

df = df.drop(columns=['Day'], errors='ignore')

# Display the first few rows of the dataset

df.head()

# Encode categorical features using LabelEncoder

label_encoders = {}
for column in df.columns:
if df[column].dtype == 'object': # Apply encoding only to categorical columns
le = LabelEncoder()
df[column] = le.fit_transform(df[column])
label_encoders[column] = le
print("----------------------------After fit and
transform------------------------------------------")
print(df)
# Define features and target
X = df.iloc[:, :-1] # All columns except the last as features
y = df.iloc[:, -1] # Last column as target

# Split the data into training and testing sets

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2,
random_state=42)

# Build the decision tree classifier using the entropy criterion

model = DecisionTreeClassifier(criterion='entropy', random_state=42)
model.fit(X_train, y_train)

# Visualize the decision tree

plt.figure(figsize=(10, 6))
plot_tree(model, feature_names=X.columns,
class_names=label_encoders[df.columns[-1]].classes_,
filled=True, rounded=True, fontsize=10)
plt.title("Simple ID3 Decision Tree for Weather Dataset")
plt.show()
Dataset:
Input:
Output:
5.Clustering
Code:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import silhouette_score, davies_bouldin_score
# Load dataset from CSV file
df = pd.read_csv('student_marks.csv') # Ensure the file exists
# Selecting relevant features
marks = df[['Subject1', 'Subject2']].values
# Standardizing the data
scaler = StandardScaler()
marks_scaled = scaler.fit_transform(marks)
# Applying K-Means Clustering
k = 2 # Number of clusters
kmeans = KMeans(n_clusters=k, random_state=42, n_init=10)
df['Cluster'] = kmeans.fit_predict(marks_scaled)
# Get centroids
centroids = kmeans.cluster_centers_
# Assign cluster names based on performance
cluster_names = {0: 'High Performers', 1: 'Low Performers'} # Modify as
needed
df['Cluster Name'] = df['Cluster'].map(cluster_names)
# Save clustered data to CSV
df.to_csv('student_marks_clustered.csv', index=False)
# Performance Metrics
inertia = kmeans.inertia_ # SSE
silhouette_avg = silhouette_score(marks_scaled, df['Cluster'])
db_index = davies_bouldin_score(marks_scaled, df['Cluster'])
print(f"Inertia (SSE): {inertia:.2f}")
print(f"Silhouette Score: {silhouette_avg:.2f}")
print(f"Davies-Bouldin Index: {db_index:.2f}")
# Display cluster-wise information
print("\nCluster Information:")
print(df.groupby('Cluster Name')[['Subject1', 'Subject2']].mean())
# Plot the clusters
plt.figure(figsize=(8, 6))
plt.scatter(marks_scaled[:, 0], marks_scaled[:, 1], c=df['Cluster'], cmap='viridis',
marker='o', edgecolors='k', label='Students')
plt.scatter(centroids[:, 0], centroids[:, 1], s=200, c='red', marker='X',
label='Centroids')
plt.xlabel('Subject 1 (Scaled)')
plt.ylabel('Subject 2 (Scaled)')
plt.title('K-Means Clustering of Student Marks')
plt.legend()
plt.show()
Dataset:
Input:
Output:
6. Support Vector Machine SVM
Code:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.svm import SVC
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score

# Read the dataset from CSV

df = pd.read_csv('Crop_recommendation.csv')
X = df.iloc[:, :-1].values
y = df.iloc[:, -1].values
print(X)
print(y)
# Split the data into training and testing sets
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2,
random_state=42)

# Standardize the features

scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

# Train and evaluate Support Vector Machine

svm_model = SVC(kernel='linear', random_state=42)
svm_model.fit(X_train, y_train)
y_pred_svm = svm_model.predict(X_test)
svm_accuracy = accuracy_score(y_test, y_pred_svm)

# Train and evaluate Logistic Regression

logreg_model = LogisticRegression(random_state=42)
logreg_model.fit(X_train, y_train)
y_pred_logreg = logreg_model.predict(X_test)
logreg_accuracy = accuracy_score(y_test, y_pred_logreg)

# Print the accuracy scores

print(f'SVM Accuracy: {svm_accuracy:.4f}')
print(f'Logistic Regression Accuracy: {logreg_accuracy:.4f}')
Dataset:
Input:

Output:

Air Drawing App Using Computer Vision Documentation
No ratings yet
Air Drawing App Using Computer Vision Documentation
25 pages
Calculus for Engineers Lab Report
No ratings yet
Calculus for Engineers Lab Report
39 pages
Modern Physics Lab 10 Experiments
No ratings yet
Modern Physics Lab 10 Experiments
75 pages
Air Drawing App Using Computer Vision Presentation
No ratings yet
Air Drawing App Using Computer Vision Presentation
12 pages
C CPP Language Complete Practice Assignment
No ratings yet
C CPP Language Complete Practice Assignment
63 pages
Dav Lab Manual
No ratings yet
Dav Lab Manual
28 pages
Supply Chain Management System Documentation
No ratings yet
Supply Chain Management System Documentation
31 pages
DA LAB MANNUAL
No ratings yet
DA LAB MANNUAL
25 pages
Applied Sociology - Full Notes
No ratings yet
Applied Sociology - Full Notes
447 pages
Umbrella Rental Vending Machine Documentation
No ratings yet
Umbrella Rental Vending Machine Documentation
23 pages
E Ticketing System UML SRS Document
No ratings yet
E Ticketing System UML SRS Document
11 pages
Aiml Practical
No ratings yet
Aiml Practical
17 pages
ML Minimized Programs
No ratings yet
ML Minimized Programs
9 pages
ML 1-10
No ratings yet
ML 1-10
53 pages
Final_ML_Programs_075005
No ratings yet
Final_ML_Programs_075005
15 pages
22K61A0654_2_sasi_auto
No ratings yet
22K61A0654_2_sasi_auto
24 pages
cr_lab[1]
No ratings yet
cr_lab[1]
5 pages
bacdeaf_23032025_115708_split_1
No ratings yet
bacdeaf_23032025_115708_split_1
37 pages
Train
No ratings yet
Train
17 pages
CP4252 Lab Manual(1)
No ratings yet
CP4252 Lab Manual(1)
13 pages
ML Assignment
No ratings yet
ML Assignment
34 pages
Digital Logic Design Lab 1
No ratings yet
Digital Logic Design Lab 1
7 pages
AI
No ratings yet
AI
16 pages
ML INTERNAL ANSWERS
No ratings yet
ML INTERNAL ANSWERS
9 pages
Ethiopia MSME Capacity Building Workshop Report
No ratings yet
Ethiopia MSME Capacity Building Workshop Report
16 pages
Online Exam Registration System UML SRS Document
No ratings yet
Online Exam Registration System UML SRS Document
14 pages
ML Chapter 7 (CLT) Notes
No ratings yet
ML Chapter 7 (CLT) Notes
59 pages
23BCE7199 ML Lab Assignment[1]
No ratings yet
23BCE7199 ML Lab Assignment[1]
15 pages
ML - Other Pracs
No ratings yet
ML - Other Pracs
7 pages
ML Journal External
No ratings yet
ML Journal External
14 pages
Decision Tree
No ratings yet
Decision Tree
6 pages
ML5_Implementation
No ratings yet
ML5_Implementation
32 pages
ML pdf
No ratings yet
ML pdf
30 pages
Determinants of Tax Awareness: A Systematic Literature Review
No ratings yet
Determinants of Tax Awareness: A Systematic Literature Review
13 pages
Pxlirr 0 G
No ratings yet
Pxlirr 0 G
63 pages
Codes for Project
No ratings yet
Codes for Project
8 pages
Calculation of Azimuth, Elevation and Polarization For Non-Horizontal Aligned Antennas
No ratings yet
Calculation of Azimuth, Elevation and Polarization For Non-Horizontal Aligned Antennas
54 pages
Module - 2 (Compiler)
No ratings yet
Module - 2 (Compiler)
39 pages
ML Internal questions
No ratings yet
ML Internal questions
15 pages
Multi Classification.py(for 1 Class Tp,Tn,Fp,Fn)
No ratings yet
Multi Classification.py(for 1 Class Tp,Tn,Fp,Fn)
25 pages
3 Classification
No ratings yet
3 Classification
16 pages
1
No ratings yet
1
13 pages
Empower Illiterate UML SRS Document
No ratings yet
Empower Illiterate UML SRS Document
14 pages
Data_preprocessing_example_programs1
No ratings yet
Data_preprocessing_example_programs1
9 pages
Project-1 (Data Preprocessing)
No ratings yet
Project-1 (Data Preprocessing)
5 pages
IEEE - The Electrical Properties of Metal Microelectrodes - 1968
No ratings yet
IEEE - The Electrical Properties of Metal Microelectrodes - 1968
7 pages
ml.yogesh
No ratings yet
ml.yogesh
23 pages
221IT027_DA_lab3 (2)
No ratings yet
221IT027_DA_lab3 (2)
5 pages
Regression Analysis - Cheatsheet
No ratings yet
Regression Analysis - Cheatsheet
9 pages
18. Bending stresses in Beams
No ratings yet
18. Bending stresses in Beams
5 pages
Stats+Medic+-++Simulation
No ratings yet
Stats+Medic+-++Simulation
2 pages
Juson-Midterm-Exam (Bsee-Pee-14-M)
No ratings yet
Juson-Midterm-Exam (Bsee-Pee-14-M)
5 pages
23BCE7092_ML_Lab_Assignment[1]
No ratings yet
23BCE7092_ML_Lab_Assignment[1]
14 pages
AI ML - Cycle 2 Programs (1)
No ratings yet
AI ML - Cycle 2 Programs (1)
15 pages
Prathamesh KRAI
No ratings yet
Prathamesh KRAI
38 pages
Animschool Introduction To 3d Animation
No ratings yet
Animschool Introduction To 3d Animation
7 pages
Slip
No ratings yet
Slip
5 pages
Chapter III - All Is Well
No ratings yet
Chapter III - All Is Well
5 pages
Machine Learning Model Building
No ratings yet
Machine Learning Model Building
6 pages
Ams Cert
No ratings yet
Ams Cert
3 pages
Post Event Recap and Analysis
No ratings yet
Post Event Recap and Analysis
11 pages
Stamped Concrete
No ratings yet
Stamped Concrete
1 page
Bastille-Rousseau Et Al (2013)
No ratings yet
Bastille-Rousseau Et Al (2013)
9 pages
ASTM-D3505-18
No ratings yet
ASTM-D3505-18
6 pages
ML
No ratings yet
ML
11 pages
AML_code_for_m2
No ratings yet
AML_code_for_m2
7 pages
Final ML File
No ratings yet
Final ML File
34 pages
Reading Comprehension. Andres IP4A
No ratings yet
Reading Comprehension. Andres IP4A
3 pages
ML Codes
No ratings yet
ML Codes
9 pages
Lecture 2
No ratings yet
Lecture 2
24 pages
ML Lab Manual
No ratings yet
ML Lab Manual
12 pages
5) Randomforest - Ipynb - Colaboratory
No ratings yet
5) Randomforest - Ipynb - Colaboratory
12 pages
Material Safety Data Sheet: Chemtherm 550
No ratings yet
Material Safety Data Sheet: Chemtherm 550
6 pages
Naive Bayes Classification
No ratings yet
Naive Bayes Classification
8 pages
DA_012307
No ratings yet
DA_012307
8 pages
Data analytics
No ratings yet
Data analytics
10 pages
Import Pandas As PD DF PD - Read - CSV ("Titanic - Train - CSV") DF - Head
No ratings yet
Import Pandas As PD DF PD - Read - CSV ("Titanic - Train - CSV") DF - Head
20 pages
Zerox Ready
No ratings yet
Zerox Ready
21 pages
ML Shristi File
No ratings yet
ML Shristi File
49 pages
Import Numpy As NP Import Pandas As PD
No ratings yet
Import Numpy As NP Import Pandas As PD
7 pages
Cheat Sheet Modeldeploy
No ratings yet
Cheat Sheet Modeldeploy
2 pages
CH 19
No ratings yet
CH 19
4 pages
Cultural Change and Adaptation in The Central Atacama Desert of Northern Chile
No ratings yet
Cultural Change and Adaptation in The Central Atacama Desert of Northern Chile
29 pages
Home Work
No ratings yet
Home Work
12 pages
Aiml Ex 4-7
No ratings yet
Aiml Ex 4-7
8 pages
ML Lab Programs (1)
No ratings yet
ML Lab Programs (1)
9 pages
Mercedes-Benz Greener Manufacturing Ai
0% (1)
Mercedes-Benz Greener Manufacturing Ai
16 pages
16BCB0126 VL2018195002535 Pe003
No ratings yet
16BCB0126 VL2018195002535 Pe003
40 pages
Machine Learning Lab: Raheel Aslam (74-FET/BSEE/F16)
No ratings yet
Machine Learning Lab: Raheel Aslam (74-FET/BSEE/F16)
3 pages
Pancha Mahabhuta - Five Great Elements: Akash (Ether)
No ratings yet
Pancha Mahabhuta - Five Great Elements: Akash (Ether)
2 pages
Limitation of Maslow
No ratings yet
Limitation of Maslow
1 page
ML Lab
No ratings yet
ML Lab
7 pages
Titanic Akshaya
No ratings yet
Titanic Akshaya
12 pages
This Study Resource Was
No ratings yet
This Study Resource Was
5 pages
Heat Conduction in Cylindrical and Spherical Coordinates I
25% (4)
Heat Conduction in Cylindrical and Spherical Coordinates I
14 pages
05 - ASTM D2270 - Standard Practice For Calculating Viscosity Index From Kinematic Viscosity at 40 and 100C
No ratings yet
05 - ASTM D2270 - Standard Practice For Calculating Viscosity Index From Kinematic Viscosity at 40 and 100C
7 pages
Bird Sanctuaries in India PDF
No ratings yet
Bird Sanctuaries in India PDF
2 pages
Alice in Wonderland Essay
No ratings yet
Alice in Wonderland Essay
5 pages
Python Cheat Sheet For Data Analysis
No ratings yet
Python Cheat Sheet For Data Analysis
2 pages
Detailed Gunner24 Action Sheet
No ratings yet
Detailed Gunner24 Action Sheet
5 pages
The Essential R Reference
From Everand
The Essential R Reference
Mark Gardener
No ratings yet

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.

Machine learning Lab Assignment 1

Uploaded by

Machine learning Lab Assignment 1

Uploaded by

ASSIGNMENT

# Display basic info

# Handle missing values (example: drop rows with missing values)

# Verify the rows are removed

# Encode categorical features

# Define features and target variable

# Scale the features

# Predict on test data

# Evaluate the model

# Encode categorical features

# Define features and target variable

# Split the dataset into training and testing sets

# Initialize the Random Forest Classifier

# Evaluate the model

# Load the weather dataset

# Remove the 'Day' feature if present

# Display the first few rows of the dataset

# Encode categorical features using LabelEncoder

# Split the data into training and testing sets

# Build the decision tree classifier using the entropy criterion

# Visualize the decision tree

# Read the dataset from CSV

# Standardize the features

# Train and evaluate Support Vector Machine

# Train and evaluate Logistic Regression

# Print the accuracy scores

You might also like

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.