100% found this document useful (1 vote)
160 views46 pages

Data Analytic Application in Mof - Why and How To

This document summarizes Sindhu Wardhana's background and experience in data analytics. It provides an overview of her education, including degrees in taxation and accounting as well as a master's in commerce with a focus on big data analytics and marketing. It also lists her current role as Vice Leader for Event, PR, and Infrastructure at the Ministry of Finance Data Analytics Community and some of her hobbies and contact information.

Uploaded by

BedahPks
Copyright
© © All Rights Reserved
We take content rights seriously. If you suspect this is your content, claim it here.
Available Formats
Download as PDF, TXT or read online on Scribd
100% found this document useful (1 vote)
160 views46 pages

Data Analytic Application in Mof - Why and How To

This document summarizes Sindhu Wardhana's background and experience in data analytics. It provides an overview of her education, including degrees in taxation and accounting as well as a master's in commerce with a focus on big data analytics and marketing. It also lists her current role as Vice Leader for Event, PR, and Infrastructure at the Ministry of Finance Data Analytics Community and some of her hobbies and contact information.

Uploaded by

BedahPks
Copyright
© © All Rights Reserved
We take content rights seriously. If you suspect this is your content, claim it here.
Available Formats
Download as PDF, TXT or read online on Scribd
You are on page 1/ 46

Penerapan Data

Analytics di
Kemenkeu

by: Sindhu Wardhana


Arifudin MH
Hello My Name Is

Nama Sindhu Wardhana


Dinas Central Transformation Office (Data Analyst)
Kuliah D3 Perpajakan STAN
D4 Akuntansi Khusus STAN
S2 Commerce Usyd (Big Data Analytic and Marketing)
MoF-DAC Vice Leader for Event, PR, and Infrastructure
Hobi Audio - Headphones
Music – Bass, Drum
Gaming
Teaching linkedin.com/in/sindhuwardhana

wardhana.sindhu@gmail.com

+6281539929499
01
Data Analitik
Data Never Sleep

“There were 5 exabytes


of information created
between the dawn of
civilization through 2003,
but that much
information is now
created every two days.”

~ Eric Schmidt, Executive


Chairman at Google

https://www.servercake.in/
Why It’s Important
Summary Webinar 1
What to do
next?

● Data Analytics Types What will


happen?

prescriptive
Why did it
happen? predictive

diagnostic foresight
What
happened?
insight

hindsight
descriptive
Descriptive dan Diagnostic

6 dari 10 penyakit dengan biaya rujukan tertinggi terkait dengan darah tinggi dan diabetes

Kelas 1 merupakan kelas layanan terbanyak untuk keenam penyakit tersebut

Ministry of Finance Data Analytics Community mofdac.id/dash1/


Predictive dan Prescriptive
Inputs

Options & Predictive


Options, Predictive
& Prescriptive

Predictive

Prescriptive

Ministry of Finance Data Analytics Community


Summary Webinar 1

● Data Analysis Process

Step 5:
Step 4: Visualize
Analyze the and Share
Step 3: data Findings
Clean the
data
Step 2:
Collect
the data
Step 1:
Define
the Data infrastructure
question Very important steps that may take up 70-90% of data analysis time
Metodologi: Data Mining Lifecycle

▪Business Understanding
▪Data Understanding
▪Data Preparation
▪Modeling
▪Evaluation
▪Deployment

▪Notice the iteration!

THE FAMOUS CRISP-DM


Data Nilai Matematika
Index school sex age address famsize Mjob Fjob guardian traveltime studytime failures freetime goout health absences Nilai1 Nilai2 Nilai3 Fail

0 GP M 18 U GT3 other services father 1 2 1 5 4 2 0 35 35 0 1


1 GP F 19 R GT3 other other other 1 3 1 1 2 3 40 65 55 55 0
2 GP F 18 U GT3 other services father 1 4 0 5 5 2 4 75 70 70 0
3 GP M 16 U GT3 other other father 2 4 0 3 2 5 0 65 75 75 0
4 GP F 17 R LE3 services services mother 1 3 0 3 2 3 3 55 55 55 0
5 GP F 18 U LE3 other other mother 2 2 0 4 3 3 2 55 55 55 0
6 GP F 17 U GT3 other other mother 1 2 0 4 4 1 4 45 45 50 0
7 GP M 16 U LE3 other other mother 2 2 0 4 2 5 18 45 35 30 1
8 MS M 18 R GT3 other other father 2 1 1 4 3 3 14 30 25 25 1
9 MS M 18 U GT3 teacher teacher father 1 2 0 2 4 2 4 75 70 70 0
10 GP F 17 U LE3 other other mother 2 2 0 4 4 1 2 70 75 75 0
11 MS M 18 R LE3 services other mother 3 1 0 4 1 5 0 55 60 50 0
12 GP F 15 U GT3 health services father 1 2 3 3 2 3 0 30 35 0 1
13 GP F 18 R GT3 other services mother 2 2 0 1 1 5 75 50 45 45 1
14 GP F 18 U LE3 other other other 1 2 0 3 3 2 0 40 40 0 1
15 GP M 15 U LE3 services other mother 1 2 0 2 2 1 0 80 90 95 0
16 MS M 20 U LE3 services services other 1 2 2 5 4 4 11 45 45 45 1
17 GP F 16 U GT3 teacher services mother 1 3 0 3 2 5 0 65 65 70 0
18 GP F 17 R GT3 at_home services father 1 3 0 3 4 5 0 55 55 50 0
19 GP F 16 U LE3 other other mother 2 2 0 4 5 4 4 50 55 45 1
20 GP M 17 U LE3 services other mother 2 1 0 5 4 5 30 40 40 40 1
21 GP F 15 R GT3 at_home other mother 1 1 0 3 1 2 8 70 65 65 0
22 GP F 17 U GT3 teacher services mother 1 3 0 4 4 4 7 50 45 45 1
23 GP M 16 U LE3 teacher other mother 1 2 0 5 1 5 2 75 75 80 0

Any Insightfor This? Data apa lagi yang bisa ditambahkan?


Questions to Answer
Menurut anda faktor apa yang menyebabkan
1 siswa gagal lulus Matematika?
1/3 siswa gagal mapel Matematika menurut
2 anda, proses business apa yang salah?
Jika anda seorang Kepala Sekolah, apa yang
3 akan anda lakukan agar tingkat kelulusan
meningkat?
4 Data apalagi yang diperlukan untuk membuat
data-driven decision?
Summary Webinar 1
Data Analytics is just
one part of Data
Analysis

● Data Analysis Process

Step 5:
Step 4: Visualize
Analyze the and Share
Step 3: data Findings
Clean the
data
Step 2:
Collect
the data
Step 1:
Define
the Data, Data, Data!
question
Types of Data

Data mana saja yang ada di


organisasi anda?

Data mana saja yang sudah


dimanfaatkan di organisasi
anda?
Human versus Machine
HUMAN MACHINE

Learn from Experience Can it learn from experience?

Something
seen/happened
in the past TASK DATA
(Historical, sensor, etc)
To be done
Summary
Metode learning apakah ini?
1. Mencari tahu apakah seseorang akan gagal dalam membayar
utangnya.
2. Mengelompokkan burung berdasarkan variable seperti warna,
ukuran, bentuk, tanpa diketahui jenisnya.
3. Menebak suhu udara di suatu tempat di keesokan hari.
4. Menghitung waktu tempuh perjalanan dari satu titik ke titik berikutnya
dengan menggunakan moda transportasi tertentu..
5. Membuat sistem facial recognition.
INISIATIF STRATEGIS DATA ANALITIK KEMENKEU 2021

CTO
Central Transformation
Office
02
CRM – Transfer Pricing
Siklus Kerja dalam CRM

Identification
Pemodelan dan
Identifikasi Pemetaan
dan Risiko
Assessment +
Evaluation Prioritisation
Penilaian
Risiko
Sains
Data

Risk Analysis
Treatment

Compliance risk management merupakan suatu Mitigasi dan


proses terstruktur dari tahap identifikasi risiko, Evaluasi Risiko
assessment, penentuan prioritas dan treatment
yang tepat untuk menindaklanjuti ketidakpatuhan
Wajib Pajak - OECD
CRM Overview: Peta Kepatuhan

Sebelum CRM Sesudah CRM


Manfaat CRM

menentukan treatment yang


tepat pada setiap Wajib
Pajak (fairness)

CRM meningkatkan pemahaman


Decision terkait perilaku kepatuhan
Support System Wajib Pajak

mengoptimalkan alokasi
fiskus sesuai dengan
kategori risiko Wajib Pajak
yang dihadapi
“Menuju Kepatuhan yang Berkelanjutan”
03
SmartWeb for
High Net Worth
Individual
Manual Lagi?
Graphs Data Science Journey
Pencarian Beneficial Owner
AS
99.17%
99.17%

AAA BBB
50% 50%
50% 99.67%

VVV SSS WWW

50% 50% 50%


50%
50%
50% 50% 50%
50%

S W E R

A
04
Ratio and Clustering
Fraud Indicator
“We should make this complicated
things, SIMPLER.”
WORD CLUSTERING

Labelling
Word Filtering
Manual labelling mau
Tahapan ini untuk
tidak mau perlu dilakukan
mendapatkan nama barang
dalam waktu beberapa
utama dan sedapat
jam saja untuk 650ribu
mungkin menghilang
lebih nama barang
merek, spesifikasi teknik
150 Clusters menjadi hanya beberapa
Mathematical dan kata tambahan lain.
kategori.
Approach “plywood ukuran 150mm” -
> “plywood” Kami melakukan auto-
Kami membuat algoritma cluster dari lebih 650rb
khusus untuk jenis barang menjadi 150
mengelompokkan kata-kata cluster yang mudah untuk
secara matematis yang bisa dilakukan labeling dan
saling mengoreksi. analisis lebih lanjut.
Ex: chrg, charg, charge =
charge
HOW WE DO IT

650k++ ±4
Jenis Barang Jam Pengerjaan
WE USE RATIO FURTHER

Kami menggunakan beberapa rasio


seperti:
1. Rasio Cluster “Lainnya” dibanding
cluster yang jelas klasifikasinya.
2. Rasio frekuensi pembelian
dibanding penjualan.
3. Rasio nilai pembelian dibandingkan
dengan nilai penjualan.
Selain rasio kami juga menggunakan
beberapa indikator lain seperti :
1. Jumlah transaksi dengan NPWP
000
2. Skala usaha dari WP
3. Scoring berdasarkan rasio dan
faktor lainnya.
Hal ini bertujuan untuk memudahkan
petugas melihat anomali dan analisis
indikator fraud.
RASIO ANALYSIS
Profil Jual Beli WP
Pemakaian Sendiri
05
DJPK- Cases - AIFA
Key Succes Factor
Dalam Implementasi DA: Studi Kasus SIKD-DJPK

1 2 3 4 5 6 7

Change Data Kolaborasi Bussiness Continuous


Leadership Management Management Infrastruktur Manusia dan Understanding Improvement
Mesin
Kilas Balik Pengelolaan Data Keuangan Daerah

SIKD

Awal Dekade Desentralisasi


Fiskal 8 tahun sebelumnya 2016 – saat ini

Proses manual dengan Pemerintah Daerah Pemanfaatan SIKD sebagai


melakukan input menyampaikan data dalam platform Pelaporan Data
dokumen/berkas hardcopy bentuk hardcopy dan softcopy Keuangan Daerah
Latar Belakang
Hal-hal yang menjadi perhatian

01
Standardisasi nomenkaltur
akun yang beragam di 542
terkait kinerja Pengelolaan
Pemerintah Daerah Keuangan Daerah: Financial Advice:
Untuk LKPD TA 2019, masih Anomaly Detection sebagai early
terdapat 57 Pemda yang

02
Penyediaan Data keuangan warning system
belum mendapatkan predikat
Daerah secara real-time, WTP dari BPK
lebih akurat dan andal
Realisasi belanja APBD untuk 4
dalma rangka mendukung tahun terakhir 94.6%, kontribusi Evaluasi kinerja realisasi APBD
perumusan kebijakan PAD 24.3%, dan belanja
(evidence-based policy) modal 19.8%
sebagai bagian untuk Saldo kas di Daerah meningkat
mendorong data-driven Forecasting pendapatan dan belanja
dari sebelumnya Rp92.1 T daerah
culture (2018) menjadi Rp102.3 T

03
(2019)
Penguatan Peran
Kementerian Keuangan Perlu dilakukan analisis
dalam meningkatkan kualitas prioritas belanja dalam rangka Analisis Prioritas Belanja untuk
pengelolaan keuangan peningkatan efisiensi belanja, meningkatkan kualitas belanja APBD
daerah realokasi, dan refocusing (misal yang lebih produktif
PEN)
Inovasi: Otomasi Financial Advisor
Bahasa Pemograman
SIKD

Pemerintah Interkoneksi
Daerah 391 Pemda*

SQL Query Python


Data Warehouse Kemenkeu:
Upload Data PostgreSQL
151 Pemda*

Text Classification

Versi Mobile Dashboard AIFA


Datawarehouse Analytics
* berdasarkan cutoff Interkoneksi per 11 Oktober 2021
Standarisasi Nomenklatur Akun
Text Classification: Contoh untuk Belanja Lingkungan Hidup

Lingkungan Hidup

Sebelumnya:
Klasifikasi manual berdasarkan input data
pada form yang sudah terstandarisasi

Sekarang:
Menggunakan corpus pada SQL
Query
Implementasi
• Penerapan artificial intelligence (AI) untuk
PAD standarisasi data menggunakan machine
learning, sehingga prosesnya lebih cepat
TKDD dan dan menghindari human errors
• Penyusunan corpus untuk meningkatkan
Lain-lain PAD yang Sah akurasi text classification hingga 100%

Belanja Modal

Standardisasi data yang


digunakan untuk analisis
selanjutnya
Dashboard

Anomaly Detection Evaluasi Kinerja Forecasting Analisis Prioritas Belanja

AIFA dashboard dapat diakses secara online dan pada versi mobile untuk mendukung pelayanan publik di masa pandemi Versi mobile
Covid-19 dalam rangka meminimalisir kontak fisik secara langsung 46
Impact
MACRO & FISCAL TECHNICAL SERVICE IMPROVEMENT
Proses penyusunan Meningkatkan relevansi dan transparansi data
laporan konsolidadi dan Perbaikan data hingga level detil, sehingga meningkatkan
100%
Akurasi terbaik
GFS lebih cepat untuk
transparansi dan
untuk Text
Classification
266x processing (16,000 menit
menjadi 60 menit)
kepercayaan stakeholders

akuntabilitas publik
Optimalisasi kas Daerah 40 4,6 100%
hingga 8.18% (Rp102 T
di akhir Tahun 2019 4Jumlah 5
Persentasi Data Indeks Kepuasan Tingkat
menjadi Rp94 T di akhir Mendekati Permintaan Layanan Respondensi
Tahun 2020) SEMESTER REAL-TIME Data (Target 4,5)
Lebih detail dan up-to-date
Realokasi dan refocusing DATA-DRIVEN CULTURE
APBD 2020 untuk pandemik Efisiensi Anggaran
30,4T Anggaran
Kesehatan Efisiensi biaya lembur
Dasar kajian
dengan Membangun data
menggunakan
22,8T Jaring
Pengaman
Efisiensi biaya arsip dan scan
dokumen
Data Analytics dan
driven-culture
dalam pembuatan
Artificial
19,2T Sosial
Pemulihan
Ekonomi Nasional Efisiensi biaya perjalanan dinas
Intelligence di
Pemerintahan
kebijakan
(evidence-based
policy)
Data Analytics Project di “Lomba Bedah Data APBD”

Fiscal Decentralization and Strategic Interaction in Dashboard ALONA to Simulate the Best Budget
Environmental Spending Structure

Quadrant Analysis of
Programs Topic Modelling to
Synchronization Analyze the Priority
between Provincial and of Local
Municipal Governments Governments’ Budget
Case Study

Silahkan akses: https://s.id/Case_APBD


THANKS

You might also like

pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy