0% found this document useful (0 votes)

187 views6 pages

Data Report Martin Inline Graphics R8 1

The document describes a unified data architecture that includes components for ingesting data from various sources, storing the data in data warehouses and lakes, and performing queries, analytics, and machine learning on the historical and current data to power dashboards, reports, and embedded analytics. The architecture aims to provide a single platform to extract, transform, load, store, query, analyze and visualize data from diverse systems and applications.

Uploaded by

Bisyron Wahyudi

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

187 views6 pages

Data Report Martin Inline Graphics R8 1

Uploaded by

Bisyron Wahyudi

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 6

A Unified Data Infrastructure Architecture

Query and Processing

Ingestion and
Sources Transformation Storage Historical Predictive Output

Connectors Data Warehouse Dashboards

OLTP Databases (Looker, Superset,
(Fivetran, Stitch,
via CDC Matillion)
(Snowflake, BigQuery, Redshift)
Mode, Tableau)

Applications/ERP Embedded
(Oracle, Salesforce,
Data Modeling Analytics
Netsuite, ...) (dbt, LookML)
(Sisense, Looker,
cube.js)
Event Collectors Workflow Data Science Platform
(Segment, Snowplow) Manager (Databricks, Domino, Sagemaker, Dataiku, Augmented
(Airflow, Dagster, DataRobot, Anaconda, ...) Analytics
Prefect)
(Thoughtspot, Outlier,
Anodot, Sisu)
Logs
Data Science and ML Libraries
(Pandas, Numpy, R, Dask, Ray, Spark, ...
Spark Platform Data Lake Scikit-learn, Pytorch, TensorFlow, Spark ML, XGBoost, ...) App Frameworks
3rd Party APIs (Databricks, EMR) (Plotly Dash, Streamlit)
(e.g., Stripe) Databricks/
Delta Lake, Iceberg, Ad Hoc Query
Python Libs Hudi, Hive Acid
(Pandas, Boto,
Engine
File and Object Dask, Ray, ...) (Presto, Dremio/ Custom Apps
Storage Drill, Impala)
Parquet,
Batch Query ORC, Avro
Engine Real-time
(Hive) Analytics
(Imply/Druid, Altinity/
S3, GCS, Clickhouse, Rockset)
ABS, HDFS

Event Streaming
(Confluent/Kafka,
Pulsar, AWS Kinesis)

Stream
Processing
(Databricks/Spark,
Confluent/Kafka, Flink)

Metadata
Management Quality and Testing Entitlements Observability
and Security (Unravel, Accel Data,
(Collibra, Alation, Hive, (Great Expectations)
(Privacera, Immuta) Fiddler)
Metastore, DataHub, ...)
Interpreting the Architecture
Query and Processing
Ingestion and
Sources Transformation Storage Historical Predictive Output

Generate relevant Extract data from Store data in a Present results of

Provide an interface for analysts and data scientists
business and operational systems format accessible to data analysis to
to derive insights (query)
operational data (E) query & processing internal and
systems external users
Execute queries and data models against stored
Deliver to storage,
data, often using distributed compute (processing)
aligning schemas Optimize for low Embed data models
between source cost, scalability, and into operational
and destination (L) analytic workloads systems and
(e.g., column store) applications
Transform data to a
structure ready for In some cases,
analysis (T) provide additional
data structures or
guarantees Describe what Predict what will
happened in the happen in the future
past (including very
recent past) Build data-driven/
ML applications

Coordinate the flow of data and the execution of computations across the full lifecycle

Ensure proper data quality, performance, and governance of all systems and datasets
Three Common Blueprints

Analytic
1 Modern Business Intelligence
Systems

2 Multimodal Data Processing

Operational
3 AI and ML
Systems
1. Modern Business Intelligence Blueprint
Query and Processing
Ingestion and
Sources Transformation Storage Historical Predictive Output

Connectors Data Warehouse Dashboards

OLTP Databases (Looker, Superset,
(Fivetran, Stitch,
via CDC Matillion)
(Snowflake, BigQuery, Redshift)
Mode, Tableau)

Event Streaming
(Confluent/Kafka,
Pulsar, AWS Kinesis)

Stream
Processing
(Databricks/Spark,
Confluent/Kafka, Flink)

Metadata
Management Quality and Testing Entitlements Observability
and Security (Unravel, Accel Data,
(Collibra, Alation, Hive, (Great Expectations)
(Privacera, Immuta) Fiddler)
Metastore, DataHub, ...)
2. Multimodal Data Processing Blueprint
Query and Processing
Ingestion and
Sources Transformation Storage Historical Predictive Output

Connectors Data Warehouse Dashboards

OLTP Databases (Looker, Superset,
(Fivetran, Stitch,
via CDC Matillion)
(Snowflake, BigQuery, Redshift)
Mode, Tableau)

Event Streaming
(Confluent/Kafka,
Pulsar, AWS Kinesis)

Stream
Processing
(Databricks/Spark,
Confluent/Kafka, Flink)

Data Transformation Model Training and Development Model Inference

Data Labeling
(Labelbox, Snorkel,
Scale, Sagemaker)

Data Sources
(Data lake + Dataflow Automation
data warehouse + (Airflow, Pachyderm, Elementl, Prefect, Tecton, Kubeflow)
streaming engine)

Query Engines Feature Store Feature Server

(Presto, Hive) (Tecton) (Tecton, Cassandra)

Data Science
Libraries
(Spark, Pandas,
NumPy, Dask)

Data Science Platform Model Batch Predictor

(Jupyter, Databricks, Domino, Sagemaker, DataRobot, Registry (Spark)
H2O, Colab, Deepnote, Noteable) (Algorithmia,
MLflow,
Sagemaker) Online Model Clients
Server
Experiment ML (TF Serving, Ray
Tracking Framework Compiler Serve, Seldon)
(Weights and (Scikit-learn, (TVM)
Biases, Comet, XGBoost, MLlib)
MLflow)
Model
DL Monitoring
Visualization Framework (Fiddler, Arthur,
(Tensorboard, (TensorFlow, Keras, Arize)
Fiddler) PyTorch, H2O,
Hugging Face)

Model Tuning
(Sigopt, hyperopt, RL Libraries
Ray Tune) (Gym, Dopamine,
RLlib, Coach)

Distributed
Processing
(Spark, Ray, Dask,
Distributed TF,
Kubeflow,
Horovod)

Agentic AI
100% (2)
Agentic AI
15 pages
Data As A Service - Lecture 202302
100% (1)
Data As A Service - Lecture 202302
49 pages
The Definitive Guide To The SQL Data Lakehouse Eckerson Report
No ratings yet
The Definitive Guide To The SQL Data Lakehouse Eckerson Report
19 pages
CS-403 S.E LabManual Jan-June 2025
No ratings yet
CS-403 S.E LabManual Jan-June 2025
44 pages
Library Stock List
No ratings yet
Library Stock List
1,032 pages
Data Lake and Data Warehouse
100% (2)
Data Lake and Data Warehouse
24 pages
Market Guide For Aiops Platforms: Infrastructure, Operations and Cloud Management
100% (2)
Market Guide For Aiops Platforms: Infrastructure, Operations and Cloud Management
27 pages
(FREE JOB) Home Based Work Without Registration Fees or Investment, Free Online Data Entry Jobs Work From Home, Part Time Typing Jobs
100% (5)
(FREE JOB) Home Based Work Without Registration Fees or Investment, Free Online Data Entry Jobs Work From Home, Part Time Typing Jobs
1 page
EaPaaS Fit-Gap Assessment and Evaluation v2
No ratings yet
EaPaaS Fit-Gap Assessment and Evaluation v2
76 pages
Atlan Guide Business Case DataOps
100% (1)
Atlan Guide Business Case DataOps
12 pages
Market Guide For DSML Engineering Platforms
100% (1)
Market Guide For DSML Engineering Platforms
15 pages
DataOps AWS Architecture Blueprint
100% (1)
DataOps AWS Architecture Blueprint
11 pages
Gartner Cloud Platforms 2024
No ratings yet
Gartner Cloud Platforms 2024
33 pages
Quantum Technology Monitor
No ratings yet
Quantum Technology Monitor
53 pages
Nigerian Air Force
No ratings yet
Nigerian Air Force
1 page
Big Data Technology Stack
100% (1)
Big Data Technology Stack
12 pages
Abiyot Kahle Thesis (Recovered) 33
No ratings yet
Abiyot Kahle Thesis (Recovered) 33
75 pages
Low Level Design
No ratings yet
Low Level Design
23 pages
InfoAdvisors MDM Neo4j Graph
100% (1)
InfoAdvisors MDM Neo4j Graph
14 pages
Data Engineering Roadmap uYdSPm5q
100% (1)
Data Engineering Roadmap uYdSPm5q
5 pages
Mlops Productionalization Brochure
No ratings yet
Mlops Productionalization Brochure
7 pages
02 - Introduction To Data Lakehouse Open-Source Technologies
No ratings yet
02 - Introduction To Data Lakehouse Open-Source Technologies
42 pages
The Essential Guide To DataOps
100% (1)
The Essential Guide To DataOps
16 pages
Curved Beam Element Stiffness Matrix Formulation
No ratings yet
Curved Beam Element Stiffness Matrix Formulation
7 pages
TESUP ATLAS7 Wind Turbine User Manual
No ratings yet
TESUP ATLAS7 Wind Turbine User Manual
31 pages
ARB 1316 - Whitepaper - DataFabric - Its Time Has Come
No ratings yet
ARB 1316 - Whitepaper - DataFabric - Its Time Has Come
35 pages
RQQ
No ratings yet
RQQ
2 pages
Magic Quadrant For Digital Experience Platforms, 2021
No ratings yet
Magic Quadrant For Digital Experience Platforms, 2021
31 pages
Co Unit3
No ratings yet
Co Unit3
41 pages
DevOps Ecosystem v2
100% (1)
DevOps Ecosystem v2
1 page
Unlocking Rapid Data Extraction: Groq + OCR and Claude Vision - by Júlio Almeida - Python in Plain E
No ratings yet
Unlocking Rapid Data Extraction: Groq + OCR and Claude Vision - by Júlio Almeida - Python in Plain E
17 pages
Streamlit Vs Dash Vs Voilà Vs Panel - Battle of The Python Dashboarding Giants - by Stephen Kilcommins - Mar, 2021 - DataDrivenInvestor
No ratings yet
Streamlit Vs Dash Vs Voilà Vs Panel - Battle of The Python Dashboarding Giants - by Stephen Kilcommins - Mar, 2021 - DataDrivenInvestor
15 pages
Report Painter - User Manual V 1.1
50% (2)
Report Painter - User Manual V 1.1
60 pages
Dynatrace Associate Mindmap 021523
No ratings yet
Dynatrace Associate Mindmap 021523
1 page
Fa1 .HLWS130-1
No ratings yet
Fa1 .HLWS130-1
14 pages
Exploiting Temporal and Depth Information For Multi-Frame Face Anti-Spoofing
No ratings yet
Exploiting Temporal and Depth Information For Multi-Frame Face Anti-Spoofing
15 pages
Gartner Reprint
No ratings yet
Gartner Reprint
33 pages
Model Examples Non Examples
No ratings yet
Model Examples Non Examples
52 pages
Intelligent Data and Analytics Fabric
No ratings yet
Intelligent Data and Analytics Fabric
18 pages
ThoughtWorks TR Technology Radar Vol 28 en
No ratings yet
ThoughtWorks TR Technology Radar Vol 28 en
47 pages
System Software and Languages
No ratings yet
System Software and Languages
55 pages
GCP - DataPlex - Building A Data Lakehouse
No ratings yet
GCP - DataPlex - Building A Data Lakehouse
19 pages
Intel OpenStack Summit Session Nov13 Final
No ratings yet
Intel OpenStack Summit Session Nov13 Final
30 pages
Data Lake Bootcamp: Building Reliable Data Lakes
No ratings yet
Data Lake Bootcamp: Building Reliable Data Lakes
29 pages
Atlan Case Study
No ratings yet
Atlan Case Study
35 pages
API-led Commerce Drives Next-Gen Digital Experiences: Whitepaper
No ratings yet
API-led Commerce Drives Next-Gen Digital Experiences: Whitepaper
21 pages
Databricks - Data Intelligence Platform For Advanced Data Architecture
No ratings yet
Databricks - Data Intelligence Platform For Advanced Data Architecture
5 pages
Apache Iceberg - Java and Python APIs
No ratings yet
Apache Iceberg - Java and Python APIs
9 pages
Pricing Strategies For Gen AI
No ratings yet
Pricing Strategies For Gen AI
11 pages
Embuk
No ratings yet
Embuk
36 pages
CARVITE Pre Approval Form
No ratings yet
CARVITE Pre Approval Form
3 pages
Data Lakes For Maximum Flexibility
No ratings yet
Data Lakes For Maximum Flexibility
29 pages
Data Mash - New Paradigm: Ristian Necula
No ratings yet
Data Mash - New Paradigm: Ristian Necula
41 pages
Toodegrees Fractal Model PDF
No ratings yet
Toodegrees Fractal Model PDF
11 pages
Flight From Strategy To Executable Code-2018 KOSTA Keynote
No ratings yet
Flight From Strategy To Executable Code-2018 KOSTA Keynote
27 pages
C Structure and Function
No ratings yet
C Structure and Function
12 pages
The 2022 Gartner Market Guide For DSML Engineering Platforms
No ratings yet
The 2022 Gartner Market Guide For DSML Engineering Platforms
15 pages
Datawarehouse To Data Lakehouse
100% (1)
Datawarehouse To Data Lakehouse
48 pages
Radwin Training Catalog
No ratings yet
Radwin Training Catalog
19 pages
Ingestion Arch
No ratings yet
Ingestion Arch
1 page
The Big Data Analytics Market 2013-2023
No ratings yet
The Big Data Analytics Market 2013-2023
21 pages
Organisational Informatics
No ratings yet
Organisational Informatics
21 pages
Data Lake Implementation Improved Processing Time by 4X
No ratings yet
Data Lake Implementation Improved Processing Time by 4X
5 pages
The Top 5 Use Cases of Graph Databases: Unlocking New Possibilities With Connected Data
No ratings yet
The Top 5 Use Cases of Graph Databases: Unlocking New Possibilities With Connected Data
13 pages
BCG Manufacturing Analytics Offering Tcm9 196530
No ratings yet
BCG Manufacturing Analytics Offering Tcm9 196530
12 pages
Large Scale Data Pipelines
No ratings yet
Large Scale Data Pipelines
91 pages
Azure Databricks
No ratings yet
Azure Databricks
5 pages
Data Report Martin Inline Graphics R7 PDF
No ratings yet
Data Report Martin Inline Graphics R7 PDF
6 pages
AI Infrastructure Reference Architecture: IBM Systems
No ratings yet
AI Infrastructure Reference Architecture: IBM Systems
28 pages
Soft v10 n12 2017 1
No ratings yet
Soft v10 n12 2017 1
20 pages
BPF Template File
No ratings yet
BPF Template File
34 pages
A Dot Matrix Printer
No ratings yet
A Dot Matrix Printer
21 pages
Smart Sensors
No ratings yet
Smart Sensors
8 pages
IBM AI Infrastructure Reference Architecture: Solution Brief
No ratings yet
IBM AI Infrastructure Reference Architecture: Solution Brief
4 pages
Oracle Apps Technical................ : Monday, 25 March 2013
No ratings yet
Oracle Apps Technical................ : Monday, 25 March 2013
51 pages
Anycubic Kobra Neo 20230109 V0.1.0 English
No ratings yet
Anycubic Kobra Neo 20230109 V0.1.0 English
34 pages
Embeddings
No ratings yet
Embeddings
13 pages
DOMAIN DRIVEN ANALYTICS - The Right Analytics Approach For Telcos
No ratings yet
DOMAIN DRIVEN ANALYTICS - The Right Analytics Approach For Telcos
1 page
ETL vs. ELT: Frictionless Data Integration - Diyotta
100% (1)
ETL vs. ELT: Frictionless Data Integration - Diyotta
3 pages
Industrial Engineering and Simulation Experience Using Flexsim Software
No ratings yet
Industrial Engineering and Simulation Experience Using Flexsim Software
6 pages
PDF 1733662736
No ratings yet
PDF 1733662736
17 pages
AC Adaptor For Blood Pressure Monitor / Nebulizer: - US Version
No ratings yet
AC Adaptor For Blood Pressure Monitor / Nebulizer: - US Version
1 page
Shallco Light Panel
No ratings yet
Shallco Light Panel
1 page
Sky Case Study From DevOps To DataOps
No ratings yet
Sky Case Study From DevOps To DataOps
4 pages
Batch Arch
No ratings yet
Batch Arch
1 page
Troubleshooting Spark Challenges
No ratings yet
Troubleshooting Spark Challenges
7 pages
Software Analysis An Design Tools
No ratings yet
Software Analysis An Design Tools
13 pages
Strategically Build A Data-Driven Enterprise With: Dataops
No ratings yet
Strategically Build A Data-Driven Enterprise With: Dataops
1 page
DATA SHEET Cloud Data Management
No ratings yet
DATA SHEET Cloud Data Management
2 pages
Infrastructure Trends and Strategies: Artificial Intelligence and Analytics
No ratings yet
Infrastructure Trends and Strategies: Artificial Intelligence and Analytics
1 page
Online Sbi Registration Form To The Branch Manager State Bank of India .
No ratings yet
Online Sbi Registration Form To The Branch Manager State Bank of India .
3 pages
Cloud Pak Offering Evolution: Predict Secure Automate
No ratings yet
Cloud Pak Offering Evolution: Predict Secure Automate
1 page
QP - 12-CS - PB-I 23-24 Set 1
No ratings yet
QP - 12-CS - PB-I 23-24 Set 1
10 pages
Chirag Sangwan Resume (1) - 1
No ratings yet
Chirag Sangwan Resume (1) - 1
1 page

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.

Data Report Martin Inline Graphics R8 1

Uploaded by

Data Report Martin Inline Graphics R8 1

Uploaded by

A Unified Data Infrastructure Architecture

Query and Processing

Connectors Data Warehouse Dashboards

Generate relevant Extract data from Store data in a Present results of

2 Multimodal Data Processing

Connectors Data Warehouse Dashboards

Connectors Data Warehouse Dashboards

Data Transformation Model Training and Development Model Inference

Query Engines Feature Store Feature Server

Data Science Platform Model Batch Predictor

You might also like

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.