0% found this document useful (0 votes)

6 views3 pages

Inbuilt Kmeans

The document is a Jupyter notebook that processes the Iris dataset using Python libraries such as pandas, numpy, and sklearn. It includes data loading, preprocessing (including one-hot encoding and scaling), and KMeans clustering to identify clusters within the data. The notebook also visualizes the sum of squared errors (SSE) for different cluster counts to help determine the optimal number of clusters.

Uploaded by

sai kolupoti

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

6 views3 pages

Inbuilt Kmeans

Uploaded by

sai kolupoti

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 3

9/23/24, 4:39 PM 21BCE2920.

ipynb - Colab

import math
import os
import gc
import random

import pandas as pd
import numpy as np
from matplotlib import pyplot as plt
import seaborn as sns
import pprint

from sklearn.cluster import KMeans

from sklearn.preprocessing import StandardScaler

input_data = pd.read_csv("Iris.csv")
input_data.head()

Id SepalLengthCm SepalWidthCm PetalLengthCm PetalWidthCm Species

0 1 5.1 3.5 1.4 0.2 Iris-setosa

1 2 4.9 3.0 1.4 0.2 Iris-setosa

2 3 4.7 3.2 1.3 0.2 Iris-setosa

3 4 4.6 3.1 1.5 0.2 Iris-setosa

4 5 5.0 3.6 1.4 0.2 Iris-setosa

Next steps: Generate code with input_data

toggle_off View recommended plots New interactive sheet

input_data.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 150 entries, 0 to 149
Data columns (total 6 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 Id 150 non-null int64
1 SepalLengthCm 150 non-null float64
2 SepalWidthCm 150 non-null float64
3 PetalLengthCm 150 non-null float64
4 PetalWidthCm 150 non-null float64
5 Species 150 non-null object
dtypes: float64(4), int64(1), object(1)
memory usage: 7.2+ KB

input_data = pd.get_dummies(input_data)
input_data = input_data.drop(['Id'], axis = 1)
input_data

Species_Iris- Species_Iris- Species_Iris-

SepalLengthCm SepalWidthCm PetalLengthCm PetalWidthCm
setosa versicolor virginica

0 5.1 3.5 1.4 0.2 True False False

1 4.9 3.0 1.4 0.2 True False False

2 4.7 3.2 1.3 0.2 True False False

3 4.6 3.1 1.5 0.2 True False False

4 5.0 3.6 1.4 0.2 True False False

... ... ... ... ... ... ... ...

145 6.7 3.0 5.2 2.3 False False True

146 6.3 2.5 5.0 1.9 False False True

147 6.5 3.0 5.2 2.0 False False True

148 6.2 3.4 5.4 2.3 False False True

149 5.9 3.0 5.1 1.8 False False True

Next steps: Generate code with input_data

toggle_off View recommended plots New interactive sheet

scaled_data = StandardScaler().fit_transform(input_data)
scaled_data[:10]

https://colab.research.google.com/drive/1FoEQ0l5WVUciLo7jL2A2eWqAuGB1pwE_#scrollTo=SPDHHI7Miz6h&printMode=true 1/3
9/23/24, 4:39 PM 21BCE2920.ipynb - Colab

array([[-0.90068117, 1.03205722, -1.3412724 , -1.31297673, 1.41421356,

-0.70710678, -0.70710678],
[-1.14301691, -0.1249576 , -1.3412724 , -1.31297673, 1.41421356,
-0.70710678, -0.70710678],
[-1.38535265, 0.33784833, -1.39813811, -1.31297673, 1.41421356,
-0.70710678, -0.70710678],
[-1.50652052, 0.10644536, -1.2844067 , -1.31297673, 1.41421356,
-0.70710678, -0.70710678],
[-1.02184904, 1.26346019, -1.3412724 , -1.31297673, 1.41421356,
-0.70710678, -0.70710678],
[-0.53717756, 1.95766909, -1.17067529, -1.05003079, 1.41421356,
-0.70710678, -0.70710678],
[-1.50652052, 0.80065426, -1.3412724 , -1.18150376, 1.41421356,
-0.70710678, -0.70710678],
[-1.02184904, 0.80065426, -1.2844067 , -1.31297673, 1.41421356,
-0.70710678, -0.70710678],
[-1.74885626, -0.35636057, -1.3412724 , -1.31297673, 1.41421356,
-0.70710678, -0.70710678],
[-1.14301691, 0.10644536, -1.2844067 , -1.4444497 , 1.41421356,
-0.70710678, -0.70710678]])

kmeans_kwargs = {
"init": "random",
"n_init": 10,
"random_state": 1,
}

sse = []
for k in range(1, 11):
kmeans = KMeans(n_clusters=k, **kmeans_kwargs)
kmeans.fit(scaled_data)
sse.append(kmeans.inertia_)
plt.plot(range(1, 11), sse)
plt.xticks(range(1, 11))
plt.xlabel("Number of Clusters")
plt.ylabel("SSE")
plt.show()

kmeans = KMeans(init="random", n_clusters=4, n_init=10, random_state=1)

kmeans.fit(scaled_data)
kmeans.labels_

array([2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2,
2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2,
2, 2, 2, 2, 2, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 3, 1, 3, 1, 1, 3, 1, 3, 1,
1, 3, 1, 3, 3, 1, 1, 1, 1, 3, 1, 3, 1, 3, 1, 1, 3, 3, 3, 1, 1, 1,
3, 3, 3, 1, 1, 1, 3, 1, 1, 1, 3, 1, 1, 1, 3, 1, 1, 3], dtype=int32)

Start coding or generate with AI.

https://colab.research.google.com/drive/1FoEQ0l5WVUciLo7jL2A2eWqAuGB1pwE_#scrollTo=SPDHHI7Miz6h&printMode=true 2/3
9/23/24, 4:39 PM 21BCE2920.ipynb - Colab

https://colab.research.google.com/drive/1FoEQ0l5WVUciLo7jL2A2eWqAuGB1pwE_#scrollTo=SPDHHI7Miz6h&printMode=true 3/3

Unit One
No ratings yet
Unit One
14 pages
7 Key Principles of Apparel Costing - Textile Tutorials
No ratings yet
7 Key Principles of Apparel Costing - Textile Tutorials
2 pages
Pattern Recognition Lab
No ratings yet
Pattern Recognition Lab
24 pages
Cell Organelle Chart-1
No ratings yet
Cell Organelle Chart-1
4 pages
How To Save Mother Earth Essay
100% (2)
How To Save Mother Earth Essay
6 pages
Merged
No ratings yet
Merged
35 pages
Rail Gun
100% (1)
Rail Gun
20 pages
Clustering
No ratings yet
Clustering
1 page
Week 6 (PCA, SVD, LDA)
No ratings yet
Week 6 (PCA, SVD, LDA)
14 pages
Core Competencies For Driving Skills Certification
No ratings yet
Core Competencies For Driving Skills Certification
2 pages
François Quesnay
No ratings yet
François Quesnay
5 pages
Macbag Msb-I Feb2012
No ratings yet
Macbag Msb-I Feb2012
1 page
Nb3 (Optional)
No ratings yet
Nb3 (Optional)
35 pages
Aam Codes
No ratings yet
Aam Codes
8 pages
Python Course Cheat Sheet
No ratings yet
Python Course Cheat Sheet
30 pages
Bài Phô Cho Học Trò
No ratings yet
Bài Phô Cho Học Trò
27 pages
Baidurya Debnath 4
No ratings yet
Baidurya Debnath 4
37 pages
Program 8
No ratings yet
Program 8
11 pages
ARB Payment Gateway REST API Integration Doc - V1.26
No ratings yet
ARB Payment Gateway REST API Integration Doc - V1.26
288 pages
Building A Brain in 10 Minutes: Perceptron Research From The 50's & 6 Perceptron Research From The 50's & 6
No ratings yet
Building A Brain in 10 Minutes: Perceptron Research From The 50's & 6 Perceptron Research From The 50's & 6
14 pages
The Alchemist Test Study Guide
No ratings yet
The Alchemist Test Study Guide
2 pages
"SAR" Games: The Technique To Help Student Writing and Compound Sentences Through Picture
No ratings yet
"SAR" Games: The Technique To Help Student Writing and Compound Sentences Through Picture
12 pages
2403res62 - CS564 - Assignment - 4 - K-Means-Iris - Intrinsic - CVIs
No ratings yet
2403res62 - CS564 - Assignment - 4 - K-Means-Iris - Intrinsic - CVIs
30 pages
'Classified Data': Import As Import As Import As Import As
No ratings yet
'Classified Data': Import As Import As Import As Import As
3 pages
Practical 5
No ratings yet
Practical 5
6 pages
SC Assignment Q2
No ratings yet
SC Assignment Q2
7 pages
Casos de ML Unsupervised Daniel Ames Camayo
No ratings yet
Casos de ML Unsupervised Daniel Ames Camayo
20 pages
Experiment - 12: Random Forest in Python
No ratings yet
Experiment - 12: Random Forest in Python
3 pages
Pra 5 ML
No ratings yet
Pra 5 ML
5 pages
BHMC17 P5.ipynb - Colaboratory
No ratings yet
BHMC17 P5.ipynb - Colaboratory
4 pages
Lab Manual ML
No ratings yet
Lab Manual ML
23 pages
Exp 8 Rushya
No ratings yet
Exp 8 Rushya
8 pages
Clustering - Jupyter Notebook
100% (1)
Clustering - Jupyter Notebook
11 pages
Implementation of Simple Linear Regression Algorithm Using Python
No ratings yet
Implementation of Simple Linear Regression Algorithm Using Python
12 pages
General Ledger of Journal 1
No ratings yet
General Ledger of Journal 1
8 pages
SE KMeansClustering
No ratings yet
SE KMeansClustering
21 pages
Tanu Raman ML Lab File
No ratings yet
Tanu Raman ML Lab File
21 pages
DSBDA6
No ratings yet
DSBDA6
6 pages
AACVPR Guidelines For AACVPR Guidelines For Pulmonary Rehabilitation Programs (4 Edition)
No ratings yet
AACVPR Guidelines For AACVPR Guidelines For Pulmonary Rehabilitation Programs (4 Edition)
37 pages
FDS Program - Colaboratory
No ratings yet
FDS Program - Colaboratory
4 pages
Prac7 8 9 10
No ratings yet
Prac7 8 9 10
12 pages
Intermediate Relay: Wiring Diagram
No ratings yet
Intermediate Relay: Wiring Diagram
1 page
Prac9 23bme053
No ratings yet
Prac9 23bme053
4 pages
7 Output
No ratings yet
7 Output
4 pages
Breeding Scheme
No ratings yet
Breeding Scheme
15 pages
Spectral Clustering
No ratings yet
Spectral Clustering
5 pages
Mini Project
No ratings yet
Mini Project
8 pages
LAB7 Kmeans
No ratings yet
LAB7 Kmeans
11 pages
BCA Final Year Project
No ratings yet
BCA Final Year Project
78 pages
S6 - Data Mining Lab Experiments (Except 1)
No ratings yet
S6 - Data Mining Lab Experiments (Except 1)
6 pages
Cheat Sheet-Building Unsupervised Learning Models
No ratings yet
Cheat Sheet-Building Unsupervised Learning Models
3 pages
ML#07
No ratings yet
ML#07
21 pages
DWDM Lab All
No ratings yet
DWDM Lab All
20 pages
EXP 07 (ML) - Sarthak
No ratings yet
EXP 07 (ML) - Sarthak
4 pages
EXAM PREPERATION - Ipynb - Colaboratory-1
No ratings yet
EXAM PREPERATION - Ipynb - Colaboratory-1
8 pages
ML2 Practical List
No ratings yet
ML2 Practical List
80 pages
Tugas Clustering - 132021012 - Kevin Gazkia Naufal
No ratings yet
Tugas Clustering - 132021012 - Kevin Gazkia Naufal
6 pages
ML 2.3 Prashant
No ratings yet
ML 2.3 Prashant
4 pages
Model Training
No ratings yet
Model Training
6 pages
KRAI LabManual
No ratings yet
KRAI LabManual
77 pages
Mlda - Lab
No ratings yet
Mlda - Lab
35 pages
Mini Project With Output
No ratings yet
Mini Project With Output
8 pages
MIT6 00SCS11 Lec20 PDF
No ratings yet
MIT6 00SCS11 Lec20 PDF
3 pages
22
No ratings yet
22
7 pages
10 - DBSCANClusteringOnIRIS-Copy1 - Jupyter Notebook
No ratings yet
10 - DBSCANClusteringOnIRIS-Copy1 - Jupyter Notebook
4 pages
PCA
No ratings yet
PCA
23 pages
EXP 07 (ML) - Ashu
No ratings yet
EXP 07 (ML) - Ashu
4 pages
EXP 07 (ML) - Darshu
No ratings yet
EXP 07 (ML) - Darshu
4 pages
Exp 07 (ML)
No ratings yet
Exp 07 (ML)
4 pages
Guidance On Road Markings
No ratings yet
Guidance On Road Markings
17 pages
ML Shristi File
No ratings yet
ML Shristi File
49 pages
Code:: To Find Frequent Itemsets and Association Between Different Itemsets Using Apriori Algorithm
No ratings yet
Code:: To Find Frequent Itemsets and Association Between Different Itemsets Using Apriori Algorithm
28 pages
INSTR F343 Industrial Instrumentation and Control Handout
No ratings yet
INSTR F343 Industrial Instrumentation and Control Handout
3 pages
ML Exp5 C36
No ratings yet
ML Exp5 C36
18 pages
Roll NO 2020
No ratings yet
Roll NO 2020
8 pages
Xudu
No ratings yet
Xudu
22 pages
Know Your Dataset: Season Holiday Weekday Workingday CNT 726 727 728 729 730
No ratings yet
Know Your Dataset: Season Holiday Weekday Workingday CNT 726 727 728 729 730
1 page
Python Matplotlib Cheat Sheet
No ratings yet
Python Matplotlib Cheat Sheet
1 page
DIVIDENDS
No ratings yet
DIVIDENDS
2 pages
Practical No - 1
No ratings yet
Practical No - 1
5 pages
Before - Reading Questions (Text 1)
100% (1)
Before - Reading Questions (Text 1)
8 pages
Bioplastic 2
No ratings yet
Bioplastic 2
13 pages
Internal and External Data Sources For MIS
No ratings yet
Internal and External Data Sources For MIS
2 pages
Full Charm SLD
0% (1)
Full Charm SLD
31 pages
On Beauty: A History of A Western Idea
No ratings yet
On Beauty: A History of A Western Idea
2 pages
5th Grade Colonial Village Unit Plan
100% (1)
5th Grade Colonial Village Unit Plan
25 pages
Philippine Indigenous Craft - ICC
No ratings yet
Philippine Indigenous Craft - ICC
8 pages
Python应用开发指南: Chinese Edition
From Everand
Python应用开发指南: Chinese Edition
Posts & Telecom Press
No ratings yet

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.

Inbuilt Kmeans

Uploaded by

Inbuilt Kmeans

Uploaded by

9/23/24, 4:39 PM 21BCE2920.

from sklearn.cluster import KMeans

Id SepalLengthCm SepalWidthCm PetalLengthCm PetalWidthCm Species

0 1 5.1 3.5 1.4 0.2 Iris-setosa

1 2 4.9 3.0 1.4 0.2 Iris-setosa

2 3 4.7 3.2 1.3 0.2 Iris-setosa

3 4 4.6 3.1 1.5 0.2 Iris-setosa

4 5 5.0 3.6 1.4 0.2 Iris-setosa

Next steps: Generate code with input_data

Species_Iris- Species_Iris- Species_Iris-

0 5.1 3.5 1.4 0.2 True False False

1 4.9 3.0 1.4 0.2 True False False

2 4.7 3.2 1.3 0.2 True False False

3 4.6 3.1 1.5 0.2 True False False

4 5.0 3.6 1.4 0.2 True False False

... ... ... ... ... ... ... ...

145 6.7 3.0 5.2 2.3 False False True

146 6.3 2.5 5.0 1.9 False False True

147 6.5 3.0 5.2 2.0 False False True

148 6.2 3.4 5.4 2.3 False False True

149 5.9 3.0 5.1 1.8 False False True

Next steps: Generate code with input_data

array([[-0.90068117, 1.03205722, -1.3412724 , -1.31297673, 1.41421356,

kmeans = KMeans(init="random", n_clusters=4, n_init=10, random_state=1)

Start coding or generate with AI.

You might also like

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.