0% found this document useful (0 votes)

16 views33 pages

Exploratory Data Analysis in R

Uploaded by

xekare1271

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

16 views33 pages

Exploratory Data Analysis in R

Uploaded by

xekare1271

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 33

Exploring

categorical data
E X P L O R AT O R Y D ATA A N A LY S I S I N R

Andrew Bray
Assistant Professor, Reed College
Comics dataset
comics

# A tibble: 23,272 x 11
name id align
<fctr> <fctr> <fctr>
1 Spider-Man (Peter Parker) Secret Identity Good
2 Captain America (Steven Rogers) Public Identity Good
3 Wolverine (James \\"Logan\\" Howlett) Public Identity Neutral
4 Iron Man (Anthony \\"Tony\\" Stark) Public Identity Good
5 Thor (Thor Odinson) No Dual Identity Good
6 Benjamin Grimm (Earth-616) Public Identity Good
7 Reed Richards (Earth-616) Public Identity Good
8 Hulk (Robert Bruce Banner) Public Identity Good
9 Scott Summers (Earth-616) Public Identity Neutral
10 Jonathan Storm (Earth-616) Public Identity Good
# ... with 23,262 more rows, and 8 more variables: eye <fctr>,
# hair <fctr>, gender <fctr>, gsm <fctr>, alive <fctr>,
# appearances <int>, first_appear <fctr>, publisher <fctr>

EXPLORATORY DATA ANALYSIS IN R

Working with factors
levels(comics$align)

"Bad" "Good" "Neutral"

"Reformed Criminals"

levels(comics$id)

"No Dual" "Public" "Secret" "Unknown" # Note: NAs ignored by levels() function

table(comics$id, comics$align)

Bad Good Neutral Reformed Criminals

No Dual 474 647 390 0
Public 2172 2930 965 1
Secret 4493 2475 959 1
Unknown 7 0 2 0

EXPLORATORY DATA ANALYSIS IN R

EXPLORATORY DATA ANALYSIS IN R
EXPLORATORY DATA ANALYSIS IN R
Bar chart
library(ggplot2) # Load package
ggplot(comics, aes(x = id, fill = align)) +
geom_bar()

EXPLORATORY DATA ANALYSIS IN R

Let's practice!
E X P L O R AT O R Y D ATA A N A LY S I S I N R
Counts vs.
proportions
E X P L O R AT O R Y D ATA A N A LY S I S I N R

Andrew Bray
Assistant Professor, Reed College
From counts to proportions
options(scipen = 999, digits = 3) # Simplify display format
tab_cnt <- table(comics$id, comics$align)
tab_cnt

Bad Good Neutral

No Dual 474 647 390
Public 2172 2930 965
Secret 4493 2475 959
Unknown 7 0 2

prop.table(tab_cnt)

Bad Good Neutral

No Dual 0.030553 0.041704 0.025139
Public 0.140003 0.188862 0.062202
Secret 0.289609 0.159533 0.061815
Unknown 0.000451 0.000000 0.000129

sum(prop.table(tab_cnt))

EXPLORATORY DATA ANALYSIS IN R

Conditional proportions
prop.table(tab_cnt, 1)

Bad Good Neutral

No Dual 0.314 0.428 0.258
Public 0.358 0.483 0.159
Secret 0.567 0.312 0.121
Unknown 0.778 0.000 0.222

EXPLORATORY DATA ANALYSIS IN R

Pie chart vs. bar chart

EXPLORATORY DATA ANALYSIS IN R

Let's practice!
E X P L O R AT O R Y D ATA A N A LY S I S I N R

R Programming Cheatsheet
100% (2)
R Programming Cheatsheet
6 pages
Systematic Training For Effective Parenting (STEP) : Descriptive Information
No ratings yet
Systematic Training For Effective Parenting (STEP) : Descriptive Information
8 pages
CH 1
No ratings yet
CH 1
24 pages
Exploratory Data Analysis in R
No ratings yet
Exploratory Data Analysis in R
40 pages
Cse512 Eda
No ratings yet
Cse512 Eda
116 pages
R Module 1 - Data Exploration
No ratings yet
R Module 1 - Data Exploration
19 pages
R Chapter4
No ratings yet
R Chapter4
8 pages
4.18 Data Wrangling Slides Part1
No ratings yet
4.18 Data Wrangling Slides Part1
54 pages
R Basic and Advanced
No ratings yet
R Basic and Advanced
9 pages
Tidy Verse
No ratings yet
Tidy Verse
76 pages
Probability Mass Functions: Allen Downey
No ratings yet
Probability Mass Functions: Allen Downey
37 pages
B - 59 - SMA - Exp 4
No ratings yet
B - 59 - SMA - Exp 4
9 pages
Lecture3 More of Chapter 2
No ratings yet
Lecture3 More of Chapter 2
50 pages
Lec448B 20160406
No ratings yet
Lec448B 20160406
30 pages
Factors in R
No ratings yet
Factors in R
6 pages
3.3.3 Logical Vectors and Binary Data
No ratings yet
3.3.3 Logical Vectors and Binary Data
5 pages
FE418 RLectureNotes1
No ratings yet
FE418 RLectureNotes1
15 pages
Friendship Prediction On Facebook
100% (34)
Friendship Prediction On Facebook
12 pages
2P1 Practical 1
No ratings yet
2P1 Practical 1
2 pages
Lec 13
No ratings yet
Lec 13
46 pages
Unit 1 Big Data Analytics - An Introduction (Final)
No ratings yet
Unit 1 Big Data Analytics - An Introduction (Final)
65 pages
Presentation of R
No ratings yet
Presentation of R
109 pages
2013 - Notes - R Trinker'S - Notes
No ratings yet
2013 - Notes - R Trinker'S - Notes
274 pages
07-ProgrammingR - Programming With Data in R
No ratings yet
07-ProgrammingR - Programming With Data in R
14 pages
Tobit Models - R Data Analysis Examples
No ratings yet
Tobit Models - R Data Analysis Examples
9 pages
EDA On Titanic Dataset
100% (1)
EDA On Titanic Dataset
39 pages
R Programming Cheat Sheet
No ratings yet
R Programming Cheat Sheet
7 pages
STAT 545A Class Meetings #5 and #6 Monday, September 23, 2013 Wednesday, September 25, 2013
No ratings yet
STAT 545A Class Meetings #5 and #6 Monday, September 23, 2013 Wednesday, September 25, 2013
74 pages
Homework 1
No ratings yet
Homework 1
17 pages
Unit3-Data Science
No ratings yet
Unit3-Data Science
37 pages
Topic 2 Analysis of Univariate Data
No ratings yet
Topic 2 Analysis of Univariate Data
87 pages
Unit 2. Teoria
No ratings yet
Unit 2. Teoria
86 pages
Lab 2
No ratings yet
Lab 2
22 pages
Assignments: Statistics Workshop 1: Introduction To R. Tuesday May 26, 2009
No ratings yet
Assignments: Statistics Workshop 1: Introduction To R. Tuesday May 26, 2009
39 pages
Charlotte Wickham: Happy R Users Purrr: Using Functional Programming To Solve Iteration Problems
No ratings yet
Charlotte Wickham: Happy R Users Purrr: Using Functional Programming To Solve Iteration Problems
81 pages
Exploratory Data Analysis in R
No ratings yet
Exploratory Data Analysis in R
50 pages
Frequency 1
No ratings yet
Frequency 1
56 pages
Lab 1a September 2118
No ratings yet
Lab 1a September 2118
3 pages
20mia1006 Lab 4 FDA
No ratings yet
20mia1006 Lab 4 FDA
15 pages
00 - Project - Your First Data Science Project - Jupyter Notebook
No ratings yet
00 - Project - Your First Data Science Project - Jupyter Notebook
8 pages
L3 Notes-1
No ratings yet
L3 Notes-1
8 pages
Agenda: 1) Assign Homework #1 (Due Wednesday 6/30) 2) Lecture Over More of Chapter 2
No ratings yet
Agenda: 1) Assign Homework #1 (Due Wednesday 6/30) 2) Lecture Over More of Chapter 2
43 pages
Data - Analysis - With - R - 24
No ratings yet
Data - Analysis - With - R - 24
47 pages
Basics of Data Analysis and Graphics in
No ratings yet
Basics of Data Analysis and Graphics in
103 pages
Data Tabulation and Frequencies
No ratings yet
Data Tabulation and Frequencies
34 pages
Unit 1 Assignment SKELETON R spr18
No ratings yet
Unit 1 Assignment SKELETON R spr18
23 pages
03 UnderstandData
No ratings yet
03 UnderstandData
29 pages
Unit-4 Big Data Analytics Methods Using R
No ratings yet
Unit-4 Big Data Analytics Methods Using R
57 pages
Lecture - 7 MSDS
No ratings yet
Lecture - 7 MSDS
32 pages
R-Cheatsheet: Help Numerical Summaries Linear Regression
No ratings yet
R-Cheatsheet: Help Numerical Summaries Linear Regression
2 pages
Functional Data Analysis With R and Matlab
No ratings yet
Functional Data Analysis With R and Matlab
220 pages
Exercises For R
No ratings yet
Exercises For R
40 pages
Applied - Data - Science MODULE 3 SEM 8
No ratings yet
Applied - Data - Science MODULE 3 SEM 8
41 pages
6) Exploratory Data Analysis
No ratings yet
6) Exploratory Data Analysis
29 pages
DR - Pierpaolo-Delser - Introduction R
No ratings yet
DR - Pierpaolo-Delser - Introduction R
83 pages
Basic Data Types
No ratings yet
Basic Data Types
48 pages
R Programming Cheat Sheet: Ata Tructures
No ratings yet
R Programming Cheat Sheet: Ata Tructures
2 pages
Module 2 ExploratoryDataAnalysis
No ratings yet
Module 2 ExploratoryDataAnalysis
22 pages
R Module 8 - Data Cleaning
No ratings yet
R Module 8 - Data Cleaning
48 pages
Differential Games
From Everand
Differential Games
Avner Friedman
No ratings yet
Shortcuts to College Calculus Refreshment Kit
From Everand
Shortcuts to College Calculus Refreshment Kit
Juan Acevedo
No ratings yet
Basic Marketing Research 7th Edition by Gilbert A Churchill Full Download
100% (1)
Basic Marketing Research 7th Edition by Gilbert A Churchill Full Download
404 pages
SSTB031 Tutorial 4 2024
No ratings yet
SSTB031 Tutorial 4 2024
4 pages
A. Adam Sloope: Skills
No ratings yet
A. Adam Sloope: Skills
3 pages
LGT2425 Lecture 3 Part II (Notes)
No ratings yet
LGT2425 Lecture 3 Part II (Notes)
55 pages
Cluster Is A Group of Objects That Belongs To The Same Class
No ratings yet
Cluster Is A Group of Objects That Belongs To The Same Class
12 pages
Fort San Pedro National High School: CJ Name Name Name
No ratings yet
Fort San Pedro National High School: CJ Name Name Name
20 pages
ISEVBS (BSIS 4A) - Lesson 1
No ratings yet
ISEVBS (BSIS 4A) - Lesson 1
12 pages
Machine Learning May 2024
No ratings yet
Machine Learning May 2024
8 pages
Research Methodology PDF
100% (3)
Research Methodology PDF
338 pages
Qualitative Data Analysis
No ratings yet
Qualitative Data Analysis
32 pages
Chapter-3 (Research Methodology)
No ratings yet
Chapter-3 (Research Methodology)
13 pages
Latihan SEM PLS Output 1
No ratings yet
Latihan SEM PLS Output 1
138 pages
ICPA Audit Planning Handout
No ratings yet
ICPA Audit Planning Handout
4 pages
FRA Milestone-1
No ratings yet
FRA Milestone-1
47 pages
Fatalitas Dan Analisis Spasial Kecelakaan Lalu Lintas Di Gunung Kidul
No ratings yet
Fatalitas Dan Analisis Spasial Kecelakaan Lalu Lintas Di Gunung Kidul
5 pages
Compendium OF Research Methods
No ratings yet
Compendium OF Research Methods
9 pages
Machine Learning-Based Predictive Analytics and Big Data in The Automotive Sector
No ratings yet
Machine Learning-Based Predictive Analytics and Big Data in The Automotive Sector
6 pages
Research 2 Final
No ratings yet
Research 2 Final
9 pages
Final Exam BWA44603
No ratings yet
Final Exam BWA44603
4 pages
Marketing Analytics
No ratings yet
Marketing Analytics
79 pages
Thesis-III - Group 5
100% (2)
Thesis-III - Group 5
6 pages
Lampiran Syntax R Sarima
No ratings yet
Lampiran Syntax R Sarima
4 pages
Cover Letter Examples For Help Desk Analyst
100% (1)
Cover Letter Examples For Help Desk Analyst
8 pages
Expression of Interest (Eoi) Document For Short Listingof Consulting Firms For
No ratings yet
Expression of Interest (Eoi) Document For Short Listingof Consulting Firms For
38 pages
Chapter 2 t2
No ratings yet
Chapter 2 t2
17 pages
Quantitative Forcasting Techniques.
No ratings yet
Quantitative Forcasting Techniques.
19 pages
I. Management and Leadership (17 Questions) : Certified Quality Engineer (Cqe) Body of Knowledge
No ratings yet
I. Management and Leadership (17 Questions) : Certified Quality Engineer (Cqe) Body of Knowledge
11 pages
Downloaded
No ratings yet
Downloaded
159 pages
Action Research Data Analysis Tutorial
No ratings yet
Action Research Data Analysis Tutorial
30 pages

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.

Exploratory Data Analysis in R

Uploaded by

Exploratory Data Analysis in R

Uploaded by

Exploring

EXPLORATORY DATA ANALYSIS IN R

"Bad" "Good" "Neutral"

Bad Good Neutral Reformed Criminals

EXPLORATORY DATA ANALYSIS IN R

EXPLORATORY DATA ANALYSIS IN R

Bad Good Neutral

Bad Good Neutral

EXPLORATORY DATA ANALYSIS IN R

Bad Good Neutral

Bad Good Neutral

EXPLORATORY DATA ANALYSIS IN R

EXPLORATORY DATA ANALYSIS IN R

EXPLORATORY DATA ANALYSIS IN R

EXPLORATORY DATA ANALYSIS IN R

EXPLORATORY DATA ANALYSIS IN R

EXPLORATORY DATA ANALYSIS IN R

No Dual Public Secret Unknown

tab_cnt <- table(comics$id, comics$align)

Bad Good Neutral

EXPLORATORY DATA ANALYSIS IN R

EXPLORATORY DATA ANALYSIS IN R

Bad Good Neutral

EXPLORATORY DATA ANALYSIS IN R

EXPLORATORY DATA ANALYSIS IN R

EXPLORATORY DATA ANALYSIS IN R

EXPLORATORY DATA ANALYSIS IN R

EXPLORATORY DATA ANALYSIS IN R

EXPLORATORY DATA ANALYSIS IN R

EXPLORATORY DATA ANALYSIS IN R

EXPLORATORY DATA ANALYSIS IN R

EXPLORATORY DATA ANALYSIS IN R

EXPLORATORY DATA ANALYSIS IN R

You might also like

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.