0% found this document useful (0 votes)

2 views10 pages

Machine Learning Programs

The document contains multiple programs demonstrating various machine learning techniques using different datasets. Key programs include creating histograms and box plots for the California Housing dataset, implementing k-Nearest Neighbors for classification, and performing Principal Component Analysis on the Iris dataset. Other programs cover decision trees, Naive Bayes classifiers, polynomial regression, and k-means clustering, showcasing a range of data analysis and predictive modeling methods.

Uploaded by

appucit2004

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

2 views10 pages

Machine Learning Programs

Uploaded by

appucit2004

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 10

PROGRAM-01: Develop a program to create histograms for all numerical features and analyze the

distribution of each feature. Generate box plots for all numerical features and identify any outliers.
Use California Housing dataset.

import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
from sklearn.datasets import fetch_california_housing

# Step 1: Load the California Housing dataset

data = fetch_california_housing(as_frame=True)
housing_df = data.frame

# Step 2: Create histograms for numerical features

numerical_features = housing_df.select_dtypes(include=[np.number]).columns

# Plot histograms
plt.figure(figsize=(15, 10))
for i, feature in enumerate(numerical_features):
plt.subplot(3, 3, i + 1)
sns.histplot(housing_df[feature], kde=True, bins=30, color='blue')
plt.title(f'Distribution of {feature}')
plt.tight_layout()
plt.show()

# Step 3: Generate box plots for numerical features

plt.figure(figsize=(15, 10))
for i, feature in enumerate(numerical_features):
plt.subplot(3, 3, i + 1)
sns.boxplot(x=housing_df[feature], color='orange')
plt.title(f'Box Plot of {feature}')
plt.tight_layout()
plt.show()

# Step 4: Identify outliers using the IQR method

print("Outliers Detection:")
outliers_summary = {}
for feature in numerical_features:
Q1 = housing_df[feature].quantile(0.25)
Q3 = housing_df[feature].quantile(0.75)
IQR = Q3 - Q1
lower_bound = Q1 - 1.5 * IQR
upper_bound = Q3 + 1.5 * IQR
outliers = housing_df[(housing_df[feature] < lower_bound) | (housing_df[feature] > upper_bound)]
outliers_summary[feature] = len(outliers)
print(f"{feature}: {len(outliers)} outliers")
PROGRAM-02: Develop a program to Compute the correlation matrix to understand the
relationships between pairs of features. Visualize the correlation matrix using a heatmap to know
which variables have strong positive/negative correlations. Create a pair plot to visualize pairwise
relationships between features. Use California Housing dataset.

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
from sklearn.datasets import fetch_california_housing

# Load California housing data

california_data = fetch_california_housing(as_frame=True)
data = california_data.frame

# Calculate the correlation matrix

correlation_matrix = data.corr()

# Plot the correlation matrix as a heatmap

plt.figure(figsize=(10,8))
sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm', fmt='.2f', linewidth=0)
plt.title('Correlation Matrix of California Housing Features')
plt.show()

# Plot pairwise relationships in the dataset

sns.pairplot(data, diag_kind='kde', plot_kws={'alpha': 0.5})
plt.suptitle('Pair Plot of California Housing Features', y=1.02)
plt.show()

PROGRAM-03: Develop a program to implement Principal Component Analysis (PCA) for reducing
the dimensionality of the Iris dataset from 4 features to 2.

import numpy as np
import matplotlib.pyplot as plt
from sklearn import datasets
from sklearn.decomposition import PCA

iris = datasets.load_iris()
X = iris.data
y = iris.target

X_centered = X - np.mean(X, axis=0)

pca = PCA(n_components=2)
X_pca = pca.fit_transform(X_centered)
#print(X_pca)
plt.figure(figsize=(8,6))
colors = ['r','g','b']
for i, color in zip(range(len(iris.target_names)),colors):
plt.scatter(X_pca[y==i,0], X_pca[y==i,1], alpha=0.8, color=color,label=iris.target_names[i])
plt.legend(loc='best', shadow=False, scatterpoints=1)
plt.title('PCA of Iris dataset')
plt.xlabel('Principal Component 1')
plt.ylabel('Principal Component 2')
plt.show()

PROOGRAM-04: For a given set of training data examples stored in a .CSV file, implement and
demonstrate the Find-S algorithm to output a description of the set of all hypotheses consistent with
the training examples.

import pandas as pd

def find_s_algorithm(file_path):
data = pd.read_csv(file_path)

print("Training data:")
print(data)

attributes = data.columns[:-1]
class_label = data.columns[-1]

hypothesis = ['?' for _ in attributes]

for index, row in data.iterrows():
if row[class_label] == 'yes':
for i, value in enumerate(row[attributes]):
if hypothesis[i] == '?' or hypothesis[i] == value:
hypothesis[i] = value
else:
hypothesis[i] = '?'
return hypothesis

file_path = 'enjoysport.csv'
hypothesis = find_s_algorithm(file_path)
print("\nThe final hypothesis is:", hypothesis)

PROOGRAM-05: Develop a program to implement k-Nearest Neighbour algorithm to classify the

randomly generated 100 values of x in the range of [0,1]. Perform the following based on dataset
generated.

a. Label the first 50 points {x1,……,x50} as follows: if (xi ≤ 0.5), then xi ε Class1, else xi ε Class1

b. Classify the remaining points, x51,……,x100 using KNN. Perform this for k=1,2,3,4,5,20,30

import numpy as np
import matplotlib.pyplot as plt
from collections import Counter

# Generate random data

data = np.random.rand(100)
labels = ["Class1" if x <= 0.5 else "Class2" for x in data[:50]]

# Euclidean distance function

def euclidean_distance(x1, x2):
return abs(x1 - x2)

# k-NN classifier function

def knn_classifier(train_data, train_labels, test_point, k):
distances = [(euclidean_distance(test_point, train_data[i]), train_labels[i]) for i in range(len(train_data))]
distances.sort(key=lambda x: x[0])
k_nearest_neighbours = distances[:k]
k_nearest_labels = [label for _, label in k_nearest_neighbours]
return Counter(k_nearest_labels).most_common(1)[0][0]

# Prepare training and testing data

train_data = data[:50]
train_labels = labels
test_data = data[50:]

# Different k-values to evaluate

k_values = [1, 2, 3, 4, 5, 20, 30]

# Results dictionary
results = {}

print("--- K-nearest-neighbour classification---")

print("Training dataset: first 50 points labeled based on the rule (x <= 0.5 -> class1, x > 0.5 ->class2)")
print("Testing dataset: Remaining 50 points to be classified\n")

# Classify test data for each k value

for k in k_values:
print(f"Result for k = {k}:")
classified_labels = [knn_classifier(train_data, train_labels, test_point, k) for test_point in test_data]
results[k] = classified_labels
for i, label in enumerate(classified_labels, start=51):
print(f"Point x{i} (value: {test_data[i-51]:.4f}) is classified as {label}")
print("\n")

print("Classification complete. \n")

# Plotting the results

for k in k_values:
classified_labels = results[k]

class1_points = [test_data[i] for i in range(len(test_data)) if classified_labels[i] == "Class1"]

class2_points = [test_data[i] for i in range(len(test_data)) if classified_labels[i] == "Class2"]

plt.figure(figsize=(10, 6))

# Plot training data

plt.scatter(train_data, [0]*len(train_data), c=["blue" if label == "Class1" else "red" for label in
train_labels], label="Training data")

# Plot classified test data

plt.scatter(class1_points, [1]*len(class1_points), color="blue", label="Class1 (Test)",marker="x")
plt.scatter(class2_points, [1]*len(class2_points), color="red", label="Class2 (Test)",marker="x")

plt.title(f'Classification results for k = {k}')

plt.xlabel('Data points')
plt.ylabel('Classification Result')
plt.legend()
plt.grid(True)
plt.show()

PROGRAM-06: Implement the non-parametric Locally Weighted Regression algorithm in order to fit
data points. Select appropriate data set for your experiment and draw graphs

import numpy as np
import matplotlib.pyplot as plt

def gaussian_kernel(x, xi, tau):

return np.exp(-np.sum((x - xi) ** 2) / (2 * tau ** 2))

def locally_weighted_regression(x, X, y, tau):

m = X.shape[0]
weights = np.array([gaussian_kernel(x, X[i], tau) for i in range(m)])
W = np.diag(weights)
X_transpose_W = X.T @ W
theta = np.linalg.inv(X_transpose_W @ X) @ X_transpose_W @ y
return x @ theta

np.random.seed(42)
X = np.linspace(0, 2 * np.pi, 100)
y = np.sin(X) + 0.1 * np.random.randn(100)
X_bias = np.c_[np.ones(X.shape), X]

x_test = np.linspace(0, 2 * np.pi, 200)

x_test_bias = np.c_[np.ones(x_test.shape), x_test]
tau = 0.5
y_pred = np.array([locally_weighted_regression(xi, X_bias, y, tau) for xi in x_test_bias])

plt.figure(figsize=(10, 6))
plt.scatter(X, y, color='red', label='Training Data', alpha=0.7)
plt.plot(x_test, y_pred, color='blue', label=f'LWR Fit (tau={tau})', linewidth=2)
plt.xlabel('X', fontsize=12)
plt.ylabel('y', fontsize=12)
plt.title('Locally Weighted Regression', fontsize=14)
plt.legend(fontsize=10)
plt.grid(alpha=0.3)
plt.show()

PROGRAM-07: Develop a program to demonstrate the working of Linear Regression and Polynomial
Regression. Use Boston Housing Dataset for Linear Regression and Auto MPG Dataset (for vehicle
fuel efficiency prediction) for Polynomial Regression.

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.datasets import fetch_california_housing
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import PolynomialFeatures, StandardScaler
from sklearn.pipeline import make_pipeline
from sklearn.metrics import mean_squared_error, r2_score
def linear_regression_california():
housing = fetch_california_housing(as_frame=True)
X = housing.data[["AveRooms"]]
y = housing.target
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
model = LinearRegression()
model.fit(X_train, y_train)
y_pred = model.predict(X_test)
plt.scatter(X_test, y_test, color="blue", label="Actual")
plt.plot(X_test, y_pred, color="red", label="Predicted")
plt.xlabel("Average number of rooms (AveRooms)")
plt.ylabel("Median value of homes ($100,000)")
plt.title("Linear Regression - California Housing Dataset")
plt.legend()
plt.show()
print("Linear Regression - California Housing Dataset")
print("Mean Squared Error:", mean_squared_error(y_test, y_pred))
print("R^2 Score:", r2_score(y_test, y_pred))
def polynomial_regression_auto_mpg():
url = "https://archive.ics.uci.edu/ml/machine-learning-databases/auto-mpg/auto-mpg.data"
column_names = ["mpg", "cylinders", "displacement", "horsepower", "weight",
"acceleration","model_year", "origin"]
data = pd.read_csv(url, sep='\s+', names=column_names, na_values="?")
data = data.dropna()
X = data["displacement"].values.reshape(-1, 1)
y = data["mpg"].values
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
poly_model = make_pipeline(PolynomialFeatures(degree=2), StandardScaler(), LinearRegression())
poly_model.fit(X_train, y_train)
y_pred = poly_model.predict(X_test)
plt.scatter(X_test, y_test, color="blue", label="Actual")
plt.scatter(X_test, y_pred, color="red", label="Predicted")
plt.xlabel("Displacement")
plt.ylabel("Miles per gallon (mpg)")
plt.title("Polynomial Regression - Auto MPG Dataset")
plt.legend()
plt.show()
print("Polynomial Regression - Auto MPG Dataset")
print("Mean Squared Error:", mean_squared_error(y_test, y_pred))
print("R^2 Score:", r2_score(y_test, y_pred))
if __name__ == "__main__":
print("Demonstrating Linear Regression and Polynomial Regression\n")
linear_regression_california()
polynomial_regression_auto_mpg()

PROGRAM-08: Develop a program to demonstrate the working of the decision tree algorithm. Use
Breast Cancer Data set for building the decision tree and apply this knowledge to classify a new
sample.

import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score
from sklearn import tree

data = load_breast_cancer()
X = data.data
y = data.target

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

clf = DecisionTreeClassifier(random_state=42)
clf.fit(X_train, y_train)
y_pred = clf.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
print(f"Model Accuracy: {accuracy * 100:.2f}%")
new_sample = np.array([X_test[0]])
prediction = clf.predict(new_sample)

prediction_class = "Benign" if prediction == 1 else "Malignant"

print(f"Predicted Class for the new sample: {prediction_class}")

plt.figure(figsize=(12,8))
tree.plot_tree(clf, filled=True, feature_names=data.feature_names, class_names=data.target_names)
plt.title("Decision Tree - Breast Cancer Dataset")
plt.show()

PROGRAM-09: Develop a program to implement the Naive Bayesian classifier considering Olivetti
Face Data set for training. Compute the accuracy of the classifier, considering a few test data sets.

import numpy as np
from sklearn.datasets import fetch_olivetti_faces
from sklearn.model_selection import train_test_split, cross_val_score
from sklearn.naive_bayes import GaussianNB
from sklearn.metrics import accuracy_score, classification_report, confusion_matrix
import matplotlib.pyplot as plt

data = fetch_olivetti_faces(shuffle=True, random_state=42)

X = data.data
y = data.target

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

gnb = GaussianNB()
gnb.fit(X_train, y_train)
y_pred = gnb.predict(X_test)

accuracy = accuracy_score(y_test, y_pred)

print(f'Accuracy: {accuracy * 100:.2f}%')

print("\nClassification Report:")
print(classification_report(y_test, y_pred, zero_division=1))

print("\nConfusion Matrix:")
print(confusion_matrix(y_test, y_pred))

cross_val_accuracy = cross_val_score(gnb, X, y, cv=5, scoring='accuracy')

print(f'\nCross-validation accuracy: {cross_val_accuracy.mean() * 100:.2f}%')
fig, axes = plt.subplots(3, 5, figsize=(12, 8))
for ax, image, label, prediction in zip(axes.ravel(), X_test, y_test, y_pred):
ax.imshow(image.reshape(64, 64), cmap=plt.cm.gray)
ax.set_title(f"True: {label}, Pred: {prediction}")
ax.axis('off')

plt.show()

PROGRAM-10: Develop a program to implement k-means clustering using Wisconsin Breast Cancer
data set and visualize the clustering result

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.datasets import load_breast_cancer
from sklearn.cluster import KMeans
from sklearn.preprocessing import StandardScaler
from sklearn.decomposition import PCA
from sklearn.metrics import confusion_matrix, classification_report
data = load_breast_cancer()
X = data.data
y = data.target
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)
kmeans = KMeans(n_clusters=2, random_state=42)
y_kmeans = kmeans.fit_predict(X_scaled)
print("Confusion Matrix:")
print(confusion_matrix(y, y_kmeans))
print("\nClassification Report:")
print(classification_report(y, y_kmeans))
pca = PCA(n_components=2)
X_pca = pca.fit_transform(X_scaled)
df = pd.DataFrame(X_pca, columns=['PC1', 'PC2'])
df['Cluster'] = y_kmeans
df['True Label'] = y
plt.figure(figsize=(8, 6))
sns.scatterplot(data=df, x='PC1', y='PC2', hue='Cluster', palette='Set1', s=100, edgecolor='black',
alpha=0.7)
plt.title('K-Means Clustering of Breast Cancer Dataset')
plt.xlabel('Principal Component 1')
plt.ylabel('Principal Component 2')
plt.legend(title="Cluster")
plt.show()
plt.figure(figsize=(8, 6))
sns.scatterplot(data=df, x='PC1', y='PC2', hue='True Label', palette='coolwarm', s=100,
edgecolor='black', alpha=0.7)
plt.title('True Labels of Breast Cancer Dataset')
plt.xlabel('Principal Component 1')
plt.ylabel('Principal Component 2')
plt.legend(title="True Label")
plt.show()
plt.figure(figsize=(8, 6))
sns.scatterplot(data=df, x='PC1', y='PC2', hue='Cluster', palette='Set1', s=100, edgecolor='black',
alpha=0.7)
centers = pca.transform(kmeans.cluster_centers_)
plt.scatter(centers[:, 0], centers[:, 1], s=200, c='red', marker='X', label='Centroids')
plt.title('K-Means Clustering with Centroids')
plt.xlabel('Principal Component 1')
plt.ylabel('Principal Component 2')
plt.legend(title="Cluster")
plt.show()

Schematic Diagram MCB-V6-En Ver.18.06 Rev.1 (GEEC)
100% (1)
Schematic Diagram MCB-V6-En Ver.18.06 Rev.1 (GEEC)
44 pages
Toyota Engineering Standard
100% (2)
Toyota Engineering Standard
10 pages
Mlalllabprgs
No ratings yet
Mlalllabprgs
17 pages
MLLab Manual
No ratings yet
MLLab Manual
24 pages
Machine Learning Lab Manual
No ratings yet
Machine Learning Lab Manual
9 pages
ML Lab Manual
No ratings yet
ML Lab Manual
24 pages
Machine Learning Lab
No ratings yet
Machine Learning Lab
33 pages
Machine Learning Lab Manual
No ratings yet
Machine Learning Lab Manual
18 pages
V
No ratings yet
V
8 pages
ML Spy Programs
No ratings yet
ML Spy Programs
16 pages
ML Programs
No ratings yet
ML Programs
14 pages
Machine Learning Lab Manual
No ratings yet
Machine Learning Lab Manual
26 pages
ML Manual
No ratings yet
ML Manual
30 pages
BCSL606 Machine Learning Lab Final Draft
No ratings yet
BCSL606 Machine Learning Lab Final Draft
32 pages
ML - Datascience Manual
No ratings yet
ML - Datascience Manual
64 pages
Machine Learning Lab Manaul BCSL606
No ratings yet
Machine Learning Lab Manaul BCSL606
27 pages
BCSL606 Machine Learning Lab
No ratings yet
BCSL606 Machine Learning Lab
33 pages
ML Labmanual
No ratings yet
ML Labmanual
33 pages
ML Lab Manual
No ratings yet
ML Lab Manual
43 pages
ML Short Code - Under Updating
No ratings yet
ML Short Code - Under Updating
4 pages
M PDF
No ratings yet
M PDF
13 pages
ML Lab Manual
No ratings yet
ML Lab Manual
25 pages
ML Journal External
No ratings yet
ML Journal External
14 pages
ML Lab Mannual1
No ratings yet
ML Lab Mannual1
37 pages
Machine Learning Lab Manual
No ratings yet
Machine Learning Lab Manual
33 pages
ML Shristi File
No ratings yet
ML Shristi File
49 pages
ML 3
No ratings yet
ML 3
24 pages
Wa0003
No ratings yet
Wa0003
16 pages
Experiment 1111
No ratings yet
Experiment 1111
25 pages
Final ML File
No ratings yet
Final ML File
34 pages
ML Lab
No ratings yet
ML Lab
9 pages
Argha's ML LAB - 240927 - 121838
No ratings yet
Argha's ML LAB - 240927 - 121838
13 pages
Shubham Pract 6 - Merged
No ratings yet
Shubham Pract 6 - Merged
12 pages
Final ML Programs 075005
No ratings yet
Final ML Programs 075005
15 pages
Lab Extern L
No ratings yet
Lab Extern L
8 pages
Strangers
No ratings yet
Strangers
8 pages
ML Minimized Programs
No ratings yet
ML Minimized Programs
9 pages
Machine Learning LAB
No ratings yet
Machine Learning LAB
20 pages
ML Full For Print New 1
No ratings yet
ML Full For Print New 1
38 pages
Lab Manual ML
No ratings yet
Lab Manual ML
23 pages
Big Data Practical
No ratings yet
Big Data Practical
20 pages
ML Manual
No ratings yet
ML Manual
9 pages
ML Lab Manual
No ratings yet
ML Lab Manual
60 pages
CP4252 Lab Manual
No ratings yet
CP4252 Lab Manual
13 pages
LAB-4 Report
No ratings yet
LAB-4 Report
21 pages
Python For Data Science IA 1 Programs
No ratings yet
Python For Data Science IA 1 Programs
14 pages
Aam Codes
No ratings yet
Aam Codes
8 pages
Unit2 ML Programs
No ratings yet
Unit2 ML Programs
7 pages
Ai Lab
No ratings yet
Ai Lab
11 pages
Lab Manual ML
No ratings yet
Lab Manual ML
26 pages
DM ML Practical
No ratings yet
DM ML Practical
13 pages
ML
No ratings yet
ML
11 pages
Roll NO 2020
No ratings yet
Roll NO 2020
8 pages
cp4252 Machine Learning Lab Manual
No ratings yet
cp4252 Machine Learning Lab Manual
21 pages
ML Lab
No ratings yet
ML Lab
14 pages
Lab4 KNN
No ratings yet
Lab4 KNN
9 pages
EX - NO:3: Algorithm
No ratings yet
EX - NO:3: Algorithm
11 pages
ML
No ratings yet
ML
5 pages
ML Lab Mannual
No ratings yet
ML Lab Mannual
29 pages
AIML Record 56
No ratings yet
AIML Record 56
28 pages
Python For Data Science IA 1 Programs
No ratings yet
Python For Data Science IA 1 Programs
14 pages
Profound Python Data Science
From Everand
Profound Python Data Science
Onder Teker
No ratings yet
Module - 3 Notes
No ratings yet
Module - 3 Notes
29 pages
IPR Patents M3
No ratings yet
IPR Patents M3
16 pages
Ai Module - 1
No ratings yet
Ai Module - 1
33 pages
SE&PM - 21CS61 - Module - 4 Notes
No ratings yet
SE&PM - 21CS61 - Module - 4 Notes
17 pages
3 Csesyll
No ratings yet
3 Csesyll
55 pages
SE & PM - 21CS61 - Module - 5 Notes
No ratings yet
SE & PM - 21CS61 - Module - 5 Notes
32 pages
SE&PM - Module 5 - Software Quality
No ratings yet
SE&PM - Module 5 - Software Quality
9 pages
Module 2 Notes 21rmi56 CB
No ratings yet
Module 2 Notes 21rmi56 CB
18 pages
CN Module 1 Notes (21CS52)
No ratings yet
CN Module 1 Notes (21CS52)
59 pages
Module 1
No ratings yet
Module 1
29 pages
Module 04
No ratings yet
Module 04
46 pages
Module 2
No ratings yet
Module 2
88 pages
13-13, Connection Box EJB 5380
No ratings yet
13-13, Connection Box EJB 5380
1 page
Cirvyn Ithinus
No ratings yet
Cirvyn Ithinus
2 pages
05 RSB Cluster
No ratings yet
05 RSB Cluster
14 pages
DLL - Mapeh 4 - Q3 - W9
No ratings yet
DLL - Mapeh 4 - Q3 - W9
4 pages
Naat Nisa Brochure 2023...
No ratings yet
Naat Nisa Brochure 2023...
4 pages
19 - Heating and Ventilating Systems - HVAC
No ratings yet
19 - Heating and Ventilating Systems - HVAC
6 pages
Trade Ultra Brochure Web
No ratings yet
Trade Ultra Brochure Web
11 pages
SP-27 - Noise Survey Report
No ratings yet
SP-27 - Noise Survey Report
4 pages
The Business of Intellectual Property A Literature Review of IP Management Research
No ratings yet
The Business of Intellectual Property A Literature Review of IP Management Research
20 pages
?simplify Allocations With SAP Analytics Cloud?
No ratings yet
?simplify Allocations With SAP Analytics Cloud?
15 pages
Double Skin Ducted Blower Split System (A5DSB-H/A5MC-H) Double Skin Ducted Blower Split System (A5DSB-H/A5MC-H)
No ratings yet
Double Skin Ducted Blower Split System (A5DSB-H/A5MC-H) Double Skin Ducted Blower Split System (A5DSB-H/A5MC-H)
1 page
Digi EX50 User Guide 90002435
No ratings yet
Digi EX50 User Guide 90002435
1,189 pages
Argus 40 Optical Swing Lane Data Sheet
No ratings yet
Argus 40 Optical Swing Lane Data Sheet
4 pages
December 2024 Statement
No ratings yet
December 2024 Statement
8 pages
TADANO 80ton GR-800EX - Specification & Load Chart PDF
0% (1)
TADANO 80ton GR-800EX - Specification & Load Chart PDF
13 pages
Pavani Profile (Salesforce Developer)
No ratings yet
Pavani Profile (Salesforce Developer)
3 pages
Specifiying Technology Readiness Levels For The Chemical Industry 2019 Buchner
100% (1)
Specifiying Technology Readiness Levels For The Chemical Industry 2019 Buchner
13 pages
(족보닷컴 미리보는 기말고사) 중3 영어 YBM (박준언)
No ratings yet
(족보닷컴 미리보는 기말고사) 중3 영어 YBM (박준언)
10 pages
Breadth First Search and Depth First Search Algorithms
No ratings yet
Breadth First Search and Depth First Search Algorithms
2 pages
Telangana State - State Eligibility Test 2023 Hall Ticket - 620822
No ratings yet
Telangana State - State Eligibility Test 2023 Hall Ticket - 620822
1 page
Central Purchase Contract
No ratings yet
Central Purchase Contract
38 pages
Full Introduction About Xilinx FPGA and Its Architecture
No ratings yet
Full Introduction About Xilinx FPGA and Its Architecture
19 pages
VL2900 Inverter Instruction
No ratings yet
VL2900 Inverter Instruction
51 pages
Exponential & Logarithmic Equations
100% (1)
Exponential & Logarithmic Equations
8 pages
HC Vibration 1
No ratings yet
HC Vibration 1
9 pages
Instruction Manual: Programmable Automatic Shift System
No ratings yet
Instruction Manual: Programmable Automatic Shift System
25 pages
Full Ordinary Differential Equations Principles and Applications Cambridge IISc Series 1st Edition A. K. Nandakumaran PDF All Chapters
No ratings yet
Full Ordinary Differential Equations Principles and Applications Cambridge IISc Series 1st Edition A. K. Nandakumaran PDF All Chapters
65 pages
Clearance Propeller PS
No ratings yet
Clearance Propeller PS
1 page

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.

Machine Learning Programs

Uploaded by

Machine Learning Programs

Uploaded by

PROGRAM-01: Develop a program to create histograms for all numerical features and analyze the

# Step 1: Load the California Housing dataset

# Step 2: Create histograms for numerical features

# Step 3: Generate box plots for numerical features

# Step 4: Identify outliers using the IQR method

# Load California housing data

# Calculate the correlation matrix

# Plot the correlation matrix as a heatmap

# Plot pairwise relationships in the dataset

X_centered = X - np.mean(X, axis=0)

hypothesis = ['?' for _ in attributes]

PROOGRAM-05: Develop a program to implement k-Nearest Neighbour algorithm to classify the

# Generate random data

# Euclidean distance function

# k-NN classifier function

# Prepare training and testing data

# Different k-values to evaluate

print("--- K-nearest-neighbour classification---")

# Classify test data for each k value

print("Classification complete. \n")

# Plotting the results

class1_points = [test_data[i] for i in range(len(test_data)) if classified_labels[i] == "Class1"]

# Plot training data

# Plot classified test data

plt.title(f'Classification results for k = {k}')

def gaussian_kernel(x, xi, tau):

def locally_weighted_regression(x, X, y, tau):

x_test = np.linspace(0, 2 * np.pi, 200)

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

prediction_class = "Benign" if prediction == 1 else "Malignant"

data = fetch_olivetti_faces(shuffle=True, random_state=42)

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

accuracy = accuracy_score(y_test, y_pred)

cross_val_accuracy = cross_val_score(gnb, X, y, cv=5, scoring='accuracy')

You might also like

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.