M1 DS21-Pengantar Sains Data Dan Analisis Big Data
M1 DS21-Pengantar Sains Data Dan Analisis Big Data
Team Teaching
PENGANTAR
SAINS DATA DAN ANALISIS BIG DATA
UNIVERSITAS GUNADARMA
Agenda
1) GAMBARAN UMUM TENTANG SAINS DATA
2) PROFIL LULUSAN SAINS DATA & TIM SAINS
DATA
3) HUBUNGAN ANTARA SAINS DATA, BIG DATA,
AI, MACHINE LEARNING & DEEP LEARNING
DEFINISI DATA SCIENCE DARI NIST
SESSION 1
APA ITU SAINS DATA
Data Scientist
APA ITU SAINS DATA
SAINS DATA: MULTI-DISIPLIN
SIKLUS HIDUP-NYA
KOMPONEN-KOMPONEN-NYA
SET KETRAMPILAN DAN PERAN DATA
SCIENTIST
PENERAPAN UTAMA SAINS DATA
PENERAPAN UTAMA SAINS DATA
PROSES SAINS DATA
DEFINISI DATA SCIENTIST DARI NIST
SESSION 2
DAFTAR PROFIL LULUSAN PRODI SAINS DATA
Profil Profesional Sains Data tergolong keluarga pekerjaan (okupasi) terkait data.
Profil ini didefinisikan sebagai perluasan dari taksonomi pekerjaan (okupasi) ESCO
(European Skills, Competences, Qualiications and Occupations)
Pekerjaan baru yang diusulkan ditempatkan dalam empat kelompok klasifikasi
teratas:
1) Manager, untuk peran manajerial
2) Professional, untuk pengembang aplikasi dan insinyur/perekayasa
infrastruktur (infrastructure engineers)
3) Teknisi dan Profesional Madya (associate professionals), untuk operator dan
teknisi
4) Pekerja pendukung klerikal (Clerical support workers) , untuk kurator dan
pengurus (stewards) data
DAFTAR PROFIL LULUSAN PRODI SAINS DATA
B. Data science researcher (S2) Data science researcher applies scientific discovery
research/process, including hypothesis and hypothesis testing,
to obtain actionable knowledge related to scientific problem,
business process, or reveal hidden relations between multiple
processes.
C. Data science architect atau system architect atau Designs and maintains the architecture of data science
applications architect (S1 atau S2) applications and facilities. Creates relevant data models and
processes worklows.
DAFTAR PROFIL LULUSAN PRODI SAINS DATA
Managers: Chief Data Officer (CDO), Data Science (group/dept) EDISON – Education for Data
manager, Data Science infrastructure manager, Research Infrastructure Intensive Science to Open New
manager science frontiers
Professionals: Data Scientist, Data Science Researcher, Data Science
Architect, Data Science (applications) programmer/engineer, Data
Analyst, Business Analyst, etc.
SESSION 3
HUBUNGAN DS-BD-AI-ML-DL DEWASA INI
Source: adaptation from Ian Goodfellow, et.al 2016 & and Matthew Mayo, 2016
MACHINE LEARNING TECHNIQUES
1. Classification
2. Regression
3. Clustering
4. Anomaly detection
5. Association
6. Recommendation
7. Dimensionality reduction
8. Computer Vision
9. Text Analytics
PROSES MACHINE LEARNING
TOOL IMPLEMENTASI: MATLAB
• Matlab https://www.mathworks.com/products/matlab.html
• Komersial versi terakhir R2020a
• Tersedia Toolbox: AI, Data Science, and Statistics
• Statistics and Machine Learning Toolbox
• Deep Learning Toolbox
• Reinforcement Learning Toolbox
• Text Analytics Toolbox
• Predictive Maintenance Toolbox
• Link buku Matlab:
https://drive.google.com/drive/folders/1qHLqc2kYrI7REC2UClijIZhrzICmm8AF?us
p=sharing
• Link buku Deep Learning with Matlab:
https://drive.google.com/drive/folders/1QuU9tAMPF-
XPwM4WmSBRiSYQoj8aA9Wg?usp=sharing
TOOL IMPLEMENTASI: RAPIDMINER
• RapidMiner https://rapidminer.com/
• platform perangkat lunak data science
• yang dikembangkan oleh perusahaan bernama sama dengan yang menyediakan lingkungan
terintegrasi untuk data preparation, machine learning, deep learning, text mining, and
predictive analytics.
• Digunakan untuk bisnis dan komersial, juga untuk penelitian, pendidikan, pelatihan, rapid
prototyping, dan pengembangan aplikasi serta mendukung semua langkah dalam proses
machine learning termasuk data preparation, results visualization, model validation and
optimization.
• RapidMiner dikembangkan pada open core model. Dengan RapidMiner Studio Free Edition,
yang terbatas untuk 1 prosesor logika dan 10.000 baris data, tersedia di bawah lisensi AGPL.
RapidMiner Studio 9.7
(https://my.rapidminer.com/nexus/account/index.html#downloads) Harga komersial
dimulai dari $2.500 dan tersedia dari pengembang.
• Link buku RapidMiner: https://drive.google.com/drive/folders/1ln2R4ryr2qj_Iwbk-
ZZT_T9wTyvpuhaN?usp=sharing
TOOL IMPLEMENTASI: R-STUDIO
MENGAPA PAKAI R LANGUAGE ?