0% acharam este documento útil (0 voto)
398 visualizações56 páginas

TCC - Data Science e Analytics (PORT)

1. O documento apresenta linhas de pesquisa para o TCC em Data Science e Analytics, incluindo Gestão e Planejamento Estratégico em Projetos de Data Science, Automação e Strategic Analytics, e Analytics e Machine Learning. 2. Para cada linha de pesquisa, há subtópicos que podem ser pesquisados e sugestões de referências bibliográficas iniciais. 3. O objetivo do documento é auxiliar alunos na escolha do tema e planejamento da execução do TCC, fornecendo uma visão ampla das á

Enviado por

brunoweinz
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd
0% acharam este documento útil (0 voto)
398 visualizações56 páginas

TCC - Data Science e Analytics (PORT)

1. O documento apresenta linhas de pesquisa para o TCC em Data Science e Analytics, incluindo Gestão e Planejamento Estratégico em Projetos de Data Science, Automação e Strategic Analytics, e Analytics e Machine Learning. 2. Para cada linha de pesquisa, há subtópicos que podem ser pesquisados e sugestões de referências bibliográficas iniciais. 3. O objetivo do documento é auxiliar alunos na escolha do tema e planejamento da execução do TCC, fornecendo uma visão ampla das á

Enviado por

brunoweinz
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd
Você está na página 1/ 56

TCC em Data Science e Analytics

áreas e linhas de pesquisa

Rogiene Batista dos Santos


Fernando Vasconcelos
TCC em Data Science e Analytics
áreas e linhas de pesquisa

Piracicaba/PECEGE
2021
© 2021 PECEGE
Todos os direitos reservados. Permitida a reprodução desde que citada a fonte.
A responsabilidade pelos direitos autorais de texto e imagens desta obra são dos autores

Organizadores
Ricardo Harbs
Daniela Flores
Aline Bigaton
Luiz Paulo Fávero

Projeto Gráfico e Editoração


Ana Paula Mendes Vidal de Negreiros

Revisão
Fernanda Latanze Mendes Rodrigues
Layane Rodrigues Vieira

F273t
SANTOS, ROGIENE BATISTA DOS.

TCC EM DATA SCIENCE ANALYTIC: ÁREAS E LINHAS DE PESQUISA


/ ROGIENE BATISTA DOS SANTOS, FERNANDO VASCONCELOS. - - PI-
RACICABA, SP : PECEGE EDITORA, 2021.

SÉRIE ACADÊMICA

ISBN: 978-65-86664-72-0

1. PLANEJAMENTO. 2. ESTRATÉGIA. 3. ESTATÍSTICA. 4. INOVAÇÃO.


I. FERNANDO VASCONCELOS. II. TÍTULO. III. SÉRIE.
CDD: 620.0072
Ficha catalográfica elaborada por Felipe Mussarelli CRB 9935/8
Apresentação
Depois de uma longa jornada no MBA em Data Science e Analytics, chegou o momento de
elaborar seu Trabalho de Conclusão de Curso [TCC]. Desenvolver o TCC é desafiador. Por isso, este
manual foi elaborado com o objetivo de auxiliar você neste processo. Neste guia inicial são indicadas
as linhas de pesquisa, métodos e procedimentos que podem ser utilizados para a elaboração do TCC.
Este manual contempla as principais áreas e subáreas em cada linha de pesquisa em Data
Science e Analytics. Sendo assim, ele é um material amplo e não exaustivo. Ou seja, há outras
áreas em Data Science e Analytics que podem ser também pesquisadas. O primeiro desafio na
elaboração do TCC é a escolha do tema a ser pesquisado. Assim, este material busca ajudar nesta
escolha e no planejamento de execução do TCC.
Tendo em vista que o início desta etapa final no MBA, muitas vezes, é cercado de dúvidas e
incertezas, espera-se que a leitura deste manual seja útil na delimitação do seu tema de pesquisa
nas seguintes linhas de temáticas: 1) Gestão e Planejamento Estratégico em Projetos de Data
Science, 2) Automação e Strategic Analytics, 3) Analytics e Machine Learning, 4) Outros Tópicos de
Machine Learning e Deep Learning, 5) Tecnologia de Negócios, e 6) Analytics para Modelos de Risco
e Gestão em Projetos de Data Science. Para cada linha de pesquisa tem-se indicado os subtópicos
que podem ser pesquisados, bem como a sugestão de referências bibliográficas a serem utilizadas
no momento inicial da definição do tema de pesquisa.
Vale ressaltar que o objetivo deste manual é auxiliar nos primeiros passos da elaboração
do TCC. Portanto, ele não substitui o manual sobre as normas para a elaboração do TCC ou
o tutorial com as instruções para a elaboração do TCC. Desta forma, esses três manuais são
complementares e têm propósito distinto nesta etapa do MBA. Por fim, é esperado que o aluno do
MBA seja capaz de identificar temas de pesquisa que sejam relevantes para a sua vida profissional e
que ele seja capaz de aplicar os conhecimentos, técnicas e ferramentas aprendidas durante o MBA.
Desejamos aos alunos e orientadores boa leitura e sucesso nesta etapa final.
Sumário

1. Gestão e Planejamento Estratégico em Projetos de Data Science 8


1.1. Transformação Digital 8
Referências 8
1.2. Indústria 4.0 9
Referências 9
1.3. Metodologias Ágeis 9
Referências 10
1.4. Cenários para Tecnologias Disruptivas 10
Referências 11
1.5. Gestão da Mudança na Era Digital 11
Referências 12
1.6. Gestão de Equipes em Projetos de Data Science 12
Referências 12
1.7. Gestão da Inovação em Operações e Serviços 13
Referências 13
1.8. Legislação no Ambiente Digital e LGPD 14
Referências 14

2. Automação e Strategic Analytics 14


2.1. Tecnologia da Informação [TI] e Inovação Tecnológica 15
Referências 15
2.2. Big Data e o Processo de Tomada de Decisão 15
Referências 16
2.3. Inteligência Artificial 16
Referências 16
2.4. Sistemas de Suporte à Decisão e Data Mining 17
Referências 17
2.5. Governança de Dados e Gestão de Dados 18
Referências 18
2.6. Segurança de Dados e Cyber Security 18
Referências 19
2.7. Business Intelligence e Data Visualization 19
Referências 19

3. Analytics e Machine Learning 20


3.1. Data Wrangling, Datasets e Escalas de Mensuração de Variáveis 20
Referências 20
3.2. Unspervised Machine Learning Techniques 21
Referências 21
3.3. Clustering 22
Referências 22
3.4. Análise Fatorial e PCA 23
Referências 23
3.5. Análise de Correspondência Simples e Múltipla 23
Referências 24
3.6. Supervised Machine Learning Techniques 24
Referências 25
3.7. Análise de Regressão Simples e Múltipla 26
Referências 26
3.8. Modelos Logísticos Binários e Multinomiais 27
Referências 27
3.9. Modelos para Dados de Contagem e Zero-Inflated Models 28
Referências 28
3.10. Modelagem Hierárquica e Multinível 29
Referências 29
3.11. Árvores de Decisão e CARTs 30
Referências 30
3.12. Ensemble Models 31
Referências 31
3.13. Random Forest 31
Referências 32
3.14. Bagging 32
Referências 32
3.15. Boosting 33
Referências 33
3.16. Redes Neurais 34
Referências 34

4. Outros Tópicos de Machine Learning e Deep Learning 35


4.1. Pesquisa Operacional 35
Referências 35
4.2. Modelos de Otimização 36
Referências 36
4.3. Modelos de Simulação 37
Referências 37
4.4. Análise Espacial 37
Referências 38
4.5. Algoritmos e Robôs 38
Referências 38
4.6. Análises de Mídias 39
Referências 39
4.7. Text Mining 40
Referências 40
4.8. Webscraping 40
Referências 41
4.9. Web Crawlers 41
Referências 41
4.10. Reconhecimento de Imagem 42
Referências 42

5. Tecnologia de Negócios 43
5.1. Cloud Computing 43
Referências 43
5.2. Tecnologias Disruptivas em Eco-Inovação e Green Supply Chain 44
Referências 44
5.3. Realidade Virtual e Aumentada 45
Referências 45
5.4. Startups 46
Referências 46
5.5. Fintechs 46
Referências 47
5.6. Smart Cities 47
Referências 47
5.7. Ecossistemas 48
Referências 48
5.8. Plataformas de Negócios Digitais 49
Referências 49

6. Analytics para Modelos de Risco e Gestão em Projetos de Data Science 49


6.1. Modelos de Gestão de Risco Operacional 50
Referências 50
6.2. Compliance em Projetos de Data Science e Analytics 50
Referências 51
6.3. Modelos de Risco de Crédito 51
Referências 52
6.4. Modelos de Risco Legal e Regulamentar 52
Referências 52
6.5. Modelos de Risco Social e Ambiental 53
Referências 53
6.6. Modelos de Risco Reputacional 54
Referências 54
6.7. Modelos de Risco Cibernético 54
Referências 55
6.8. Gestão de Investimentos e Valuation de Empresas 55
Referências 55
R. B. dos Santos e F. Vasconcelos

1. Gestão e Planejamento Estratégico em Projetos de Data Science


Nos últimos anos, o Data Science tem se tornado uma solução promissora para as empresas e
organizações. Assim, por ser uma área relativamente nova, há alguns desafios. Entre eles, como realizar
a gestão e o planejamento estratégico de projetos em Data Science. Desta forma, há diversos aspectos
que precisam ser considerados no processo de gerir e planejar projetos nessa área. A seguir, serão
apresentados alguns subtópicos de pesquisa que podem ser considerados para a elaboração do TCC
nesse curso de MBA.

1.1. Transformação Digital


A Transformação Digital é um fenômeno que tem afetado as organizações, sendo caracterizada pelo
uso de tecnologias digitais para resolver problemas associados à produtividade, à agilidade e à eficácia
das operações em ambientes corporativos. Desta forma, a transformação digital tem levado as empresas
a uma mudança estrutural, razão pela qual algumas pesquisas têm buscado analisar o efeito desta
transformação na sociedade e no contexto dos negócios. No caso do desenvolvimento de um TCC, o aluno
pode investigar, por exemplo, o impacto da adoção de tecnologias digitais sobre a produtividade e/ou
a renda auferida por uma ou mais organizações. Além disso, também é possível realizar comparações
entre empresas, classificando-as de acordo com a intensidade ou o grau de maturidade no uso dessas
tecnologias. Mais recentemente, a pandemia coronavírus forçou diversos setores a realizar ajustes
caracterizados, principalmente, pelo uso de tecnologias digitais para a manutenção das transações. Assim,
uma análise dessas transformações, em determinada organização ou setor, também pode ser uma
alternativa interessante para a elaboração do TCC. Um exemplo de pesquisa nessa área é a desenvolvida
por Okano et al. (2020), que analisou como as plataformas digitais afetam a transformação digital em
dispositivos móveis. Mais especificamente, no estudo foi investigado como os usuários de smartphones
estão se adaptando à transformação digital. Para esses tipos de pesquisa, o aluno poderá utilizar-se da
aplicação de um questionário ou realização de entrevistas em uma ou mais organizações de forma a
verificar como elas estão lidando com o tema transformação digital.

Referências
Albertin, A.L.; Albertin, R.M.M. 2021. Transformação digital: gerando valor para o” novo futuro”. GV Executivo,
20(1): 26-29. Disponível em: https://rae.fgv.br/gv-executivo/vol20-num1-2021/transformacao-digital-gerando-
valor-para-novo-futuro. Acesso em: 28 mar. 2021.

Brunetti, F.; Matt, D.T.; Bonfanti, A.; De Longhi, A.; Pedrini, G.; Orzes, G. 2020. Digital transformation
challenges: strategies emerging from a multi-stakeholder approach. The TQM Journal, 32(4):
697-724. Disponível em: <https://www.emerald.com/insight/content/doi/10.1108/TQM-12-2019-
0309/full/html?casa_token=A1hm-yXwGUUAAAAA:rqmbBDhHdAZ_M5wCplmIjLZa09XX8y1x_
a1fLGUNe8jN4RU4Uh5ue3zlqFjc5ukNgVfRFRM50CGOI75tXL_p8cP_OrVbjGGVcpJHERC-V7WEwUIKP_U>.
Acesso em: 28 mar. 2021.

Okano, M.T.; Simões, E.A.; Langhi, C. 2020. Plataformas de negócios digitais: o poder da transformação digital
nos dispositivos móveis. Research, Society and Development, 9(2): e95922097. Disponível em: <https://
rsdjournal.org/index.php/rsd/article/view/2097>. Acesso em: 28 mar. 2021.

Oliveira, G.M.D. 2021. Nova economia e Território: um estudo das tecnologias da informação. Sociedade
& Natureza, 33: e56230. Disponível em: <https://www.scielo.br/scielo.php?pid=S1982-
45132021000100202&script=sci_arttext&tlng=pt>. Acesso em: 28 mar. 2021.

Silva, N. 2018. Transformação digital, a 4ª revolução industrial. Boletim de Conjuntura, (8): 15-18. Disponível
em: <https://fgvenergia.fgv.br/sites/fgvenergia.fgv.br/files/coluna_opiniao_-_transformacao_digital.pdf>.
Acesso em: 28 mar. 2021.

Weiss, M.C. 2019. Sociedade sensoriada: a sociedade da transformação digital. Estudos avançados, 33(95):
203-214. Disponível em: <https://www.scielo.br/scielo.php?pid=S0103-40142019000100203&script=sci_
arttext>. Acesso em: 28 mar. 2021.

8
TCC em Data Science e Analytics: áreas e linhas de pesquisa

1.2. Indústria 4.0


A Indústria 4.0 é considerada a Quarta Revolução Industrial, pois utiliza novas formas de solução de
problemas corporativos, tais como tecnologias para automação, troca de dados e sistemas ciber-físicos
(Internet das Coisas e Computação em Nuvem). Em março de 2020 o mundo foi surpreendido pelo
COVID-19, assim, muitas empresas que ainda não utilizavam estas tecnologias, passaram a utilizá-las de
forma obrigatória em alguns casos.
Uma ideia interessante para o TCC é verificar por meio de questionários ou entrevistas se as
empresas automatizaram mais as suas operações e se elas passaram a utilizar a computação em nuvem
de forma que os seus funcionários pudessem trabalhar no formato home office.
Outra ideia de desenvolvimento de trabalho surge a partir da pesquisa realizada por Xu e Li
(2018), na qual eles compararam se as empresas combinam tecnologias tradicionais com as novas da
Indústria 4.0. Assim, no TCC o aluno pode comparar dois grupos de empresas: a) Aquelas que utilizam
somente tecnologias tradicionais, e b) as organizações que utilizam novas tecnologias da Indústria 4.0,
para certificar se o desempenho financeiro delas é diferente ou não. Neste sentido, pode-se fazer um
levantamento por meio de questionário ou dados secundários de pesquisa e analisar se as empresas
combinam ou não tecnologias tradicionais com as novas tecnologias, com a finalidade de identificar os
benefícios e dificuldades de implantação da Industria 4.0.
Outra ideia de pesquisa pode ter como base a pesquisa de Ghobakhloo (2020), na qual ele analisou
a Indústria. 4.0 a partir da perspectiva da sustentabilidade. Assim, no TCC, o aluno pode verificar se as
empresas que consideram a sustentabilidade no processo da Indústria 4.0 obtêm mais eficiência e maior
nível de inovação. Esse tipo de estudo pode ser realizado com a aplicação de questionários ou realização
de entrevistas de forma a pesquisar se as empresas estão considerando a sustentabilidade no processo
de adaptação à indústria 4.0.

Referências
Akgül, B.; Zeynep, A.Y.E.R. 2020. The Change In The Management Structure Of Media Institutions In The Fourth
Industrial Revolution (Industry 4.0) Process. Journal of Life Economics, 7(2): 151-160. Disponível em: <https://
dergipark.org.tr/en/pub/jlecon/issue/54482/741980>. Acesso em: 28 mar. 2021.

Borges, L.G.N.L.; Sales, A.B.; Carbhiaki, G.; Viana, L.D. 2020. Desenvolvimento de modelagem de liderança para
a Revolução 4.0. FTT Journal of Engineering and Business, 1(5): 19-33. Disponível em: <http://journal.ftt.com.br/
seer/index.php/FTT/article/view/135>. Acesso em: 28 mar. 2021.

Galati, F.; Bigliardi, B. 2019. Industry 4.0: Emerging themes and future research avenues using a text mining
approach. Computers in Industry, 109(1): 100-113. Disponível em: <https://www.sciencedirect.com/science/
article/pii/S0166361518307772?casa_token=iiGc_ekMHyYAAAAA:dAVCJIJ74sghvLkhLasjQvlIrxTnQoHzuNokUD
5V-JLotHURvcJdgxCzilqwVvyhkBv8WI0X3Q>. Acesso em: 28 mar. 2021.

Ghobakhloo, M. 2020. Industry 4.0, digitization, and opportunities for sustainability. Journal of
Cleaner Production, 252(1): 1-21. Disponível em: <https://www.sciencedirect.com/science/article/pii/
S0959652619347390?casa_token=vWJy-TqY0I4AAAAA:GMVpSHD5smEfs1f6El-1BHgC4dO4BBOQ3LW-bse8aAB
7Tl5bH5HnTotKAT3jfRyl2j2WPWwXCw>. Acesso em: 28 mar. 2021.

Santos, B.P.; Alberto, A.; Lima, T.D.F.M.; Charrua-Santos, F.M.B. 2018. Indústria 4.0: desafios e
oportunidades. Revista Produção e Desenvolvimento, 4(1): 111-124. Disponível em: <https://revistas.cefet-rj.br/
index.php/producaoedesenvolvimento/article/view/316>. Acesso em: 28 mar. 2021.

Xu, L.D.; Xu, E.L.; Li, L. 2018. Industry 4.0: state of the art and future trends. International Journal of Production
Research, 56(8): 2941-2962. Disponível em: <https://www.tandfonline.com/doi/abs/10.1080/00207543.2018.14
44806>. Acesso em: 28 mar. 2021.

1.3. Metodologias Ágeis


As Metodologias Ágeis surgiram a partir de um modelo e uma filosofia que propõem novas
alternativas à gestão de projetos tradicionais. Nesse sentido, o aluno pode desenvolver seu

9
R. B. dos Santos e F. Vasconcelos

TCC verificando se as empresas que utilizam metodologias ágeis melhoraram seu processo de
desenvolvimento de produtos e serviços. Outra ideia para o TCC é analisar como as empresas têm
encontrado soluções para resolver problemas na gestão de projetos em tecnologia da informação
mediante a utilização de metodologias ágeis. Essas duas pesquisas podem ser realizadas por meio
de entrevistas com os gestores. Assim, será possível compreender o impacto da utilização de
metodologias ágeis no portfólio de produtos e serviços das empresas, além de entender quais as
soluções que as empresas têm aplicado para resolver problemas de gestão de projetos em TI. Outro
exemplo de pesquisa que pode ser tomada como base foi a realizada por Oliveira e Glória (2019), na
qual eles propuseram uma solução algorítmica de forma a resolver o impasse no sequenciamento de
tarefas na gestão de projetos de Tecnologia da Informação [TI] que utilizam a metodologia ágil scrum.
Similarmente, o aluno no TCC pode criar um algoritmo que auxilie as empresas na solução de problemas
na gestão de projetos em TI, tais como mudanças constantes de escopo, má gestão de recursos
humanos e falta de gestão de riscos. Outra possibilidade de pesquisa que o aluno pode considerar
para embasamento na elaboração de seu TCC é a de Ramos et al. (2020), na qual os autores realizaram
um estudo de caso em uma startup de pequena escala, para fins de comparar as metodologias de
gerenciamento de projetos ágil e tradicional. Assim, a partir dos dados e do entendimento do objetivo
proposto pelo “Lean Startup”, foi possível considerar o tempo e o aprendizado como os principais
fatores de sucesso dentro do ambiente de incerteza vivido pela startup estudada. Esse tipo de estudo
também pode ser realizado no TCC mediante realização de um estudo de caso em uma startup,
para conferir como ela utiliza as metodologias ágeis, fazendo uma análise dos impactos positivos da
utilização destas.

Referências
Gruber, V.; Silva, N.N.G.; Mendes, F.L.; Lavina, M.E.; Santos, G.F. 2020. Análise do project model canvas para
gestão de projetos com foco em inovação. Humanidades & Inovação, 7(9): 334-345. Disponível em: <https://
revista.unitins.br/index.php/humanidadeseinovacao/article/view/2744>. Acesso em: 28 mar. 2021.

Kalenda, M.; Hyna, P.; Rossi, B. 2018. Scaling agile in large organizations: Practices, challenges, and success
factors. Journal of Software: Evolution and Process, 30(10): 1-24. Disponível em: <https://onlinelibrary.wiley.
com/doi/full/10.1002/smr.1954?casa_token=IQ_fuHkQyaIAAAAA%3At7vD3bTStf3pe4rA_4-U5RP3eZRHVLaKPG
r8Mp7gVQumhSDLKca4HqOjdSw7ZU4NeyvU4BhWZTn3lM8>. Acesso em: 28 mar. 2021.

Oliveira, D.A; Glória, I.J. 2019. Uma solução algorítmica para o impasse no sequenciamento de tarefas na
gestão de projetos de ti que utilizam a metodologia ágil scrum. Iberoamerican Journal of Project Management,
10(1): 71-88. Disponível em: <http://www3.fi.mdp.edu.ar/riipro/journal/index.php/IJOPM/article/view/449>.
Acesso em: 28 mar. 2021.

Ramos, G.R.; Assis Silva, W.; Seleme, R.; Marques, M.A.M.; Gressler, F. 2020. Comparação entre metodologias
de gerenciamento de projetos ágil e tradicional: Um estudo de caso em uma Startup de pequena
escala. Brazilian Journal of Development, 6(3): 15025-15047. Disponível em: <https://www.brazilianjournals.
com/index.php/BRJD/article/view/8047>. Acesso em: 28 mar. 2021.

Stopa, G.R.; Rachid, C.L. 2019. Scrum: Metodologia ágil como ferramenta de gerenciamento de projetos. CES
Revista, 33(1): 302-323. Disponível em: <https://seer.cesjf.br/index.php/cesRevista/article/view/2026>. Acesso
em: 28 mar. 2021.

Zielske, M.; Held, T. 2021. Application of agile methods in traditional logistics companies and logistics
startups: Results from a German Delphi Study. Journal of Systems and Software, 177, 110950. Disponível
em: <https://www.sciencedirect.com/science/article/pii/S0164121221000479?casa_token=csWmxAVdt-
AAAAAA:cRZd4KMZlVXvKm-38YAIVwjkd6_B5AdhYVcNaR5XFXvQvc4e7IDafC5pQGaH0t7WTYdj2MN2ag>.
Acesso em: 28 mar. 2021.

1.4. Cenários para Tecnologias Disruptivas


A transformação digital tem criado cenários corporativos para a utilização de tecnologias
disruptivas, ou seja, aquelas que provocam uma ruptura com os padrões, modelos ou tecnologias

10
TCC em Data Science e Analytics: áreas e linhas de pesquisa

já estabelecidos no mercado. Alguns exemplos de negócios disruptivos são: AirBnb, Netflix e Uber.
Seguindo por essa temática, o aluno em seu TCC pode realizar uma pesquisa similar à de Serrano e
Baldanza (2017), na qual eles realizaram um estudo de caso da empresa Uber e identificaram quais
aspectos e características diferenciam o serviço de táxis tradicional e o serviço que a empresa Uber
oferece, isso ocorre a partir da apresentação pelos autores das inovações disruptivas utilizadas por
esta empresa. Da mesma forma, é possível realizar no TCC um estudo de caso em empresas que
utilizam tecnologias disruptivas com o objetivo de constatar como essas tecnologias inovadoras afetam
os negócios. O aluno também pode, em seu TCC, apurar a utilização de tecnologias disruptivas no
contexto do agronegócio tomando como base o estudo de Sausen et al. (2020). Nesta pesquisa o aluno
poderá fazer um levantamento por meio de questionários e entrevistas para aferir quais tecnologias
disruptivas são utilizadas no setor agrícola visando aperfeiçoar a forma de produzir alimentos. Desta
forma, será possível verificar se as empresas agrícolas no Brasil têm utilizado ou não tecnologias
disruptivas em suas operações, além de investigar quais dessas tecnologias são mais utilizadas.

Referências
Abdel-Basset, M.; Chang, V.; Nabeeh, N.A. 2021. An intelligent framework using disruptive
technologies for COVID-19 analysis. Technological Forecasting and Social, Change 163(1): 1-14.
Disponível em: <https://www.sciencedirect.com/science/article/pii/S0040162520312579?casa_
token=wgCxErjI2PEAAAAA:yrwY9bUdp0HoODyv86ZX_KkQXukdtbiAluMvUL3kNHGg3uyzcnlNuRV
le-MipRMGYcDfzgJccQ>. Acesso em: 28 mar. 2021.

Bongomin, O.; Ocen, G.G.; Nganyi, E.O.; Musinguzi, A.; Omara, T. 2020. Exponential disruptive technologies and
the required skills of industry 4.0. Journal of Engineering, 1(1): 1-17. Disponível em: <https://www.hindawi.com/
journals/je/2020/4280156/>. Acesso em: 28 mar. 2021.

Galanakis, C.M.; Rizou, M.; Aldawoud, T.M.; Ucak, I.; Rowan, N.J. 2021. Innovations and technology disruptions in
the food sector within the COVID-19 pandemic and post-lockdown era. Trends in Food Science & Technology,
110(1): 193-200. Disponível em: < https://www.sciencedirect.com/science/article/pii/S0924224421001035>.
Acesso em: 28 mar. 2021.

Montoya, G.N. 2020. Aproveitamento de tecnologias disruptivas na cadeia de suprimentos em tempo de


pandemia. Revista Diálogos Acadêmicos IESCAMP, 4(2): 15-21. Disponível em: <https://revista.iescamp.com.br/
index.php/redai/article/view/89>. Acesso em: 28 mar. 2021.

Sausen, D.; Marques, L.P.; Costa, G.A.; Melo, M.C.; Azevedo, L.B. 2021. Agrotecnologias disruptivas. Revista
Eletrônica Competências Digitais para Agricultura Familiar, 6(2): 41-68. Disponível em: <https://owl.tupa.unesp.
br/recodaf/index.php/recodaf/article/view/126>. Acesso em: 28 mar. 2021.

Serrano, P.H.S.M.; Baldanza, R.F. 2017. Tecnologias disruptivas: o caso do Uber. Revista Pensamento
Contemporâneo em Administração, 11(5): 37-48. Disponível em: <https://www.redalyc.org/
pdf/4417/441753779011.pdf>. Acesso em: 28 mar. 2021.

1.5. Gestão da Mudança na Era Digital


Um dos desafios na Era Digital é a gestão da mudança. A transformação digital pode causar
impactos consideráveis nas empresas, mas nem todas percebem esse processo. Assim, no TCC o aluno
pode verificar como as empresas têm utilizado a gestão da mudança no processo da transformação
digital. Uma possibilidade de desenvolvimento do trabalho é a realização de um estudo de caso com
uma empresa que passou por este processo e verificar quais foram os desafios enfrentados por ela.
Outra possibilidade seria o aluno fazer um levantamento por meio de questionário para mapear se as
empresas que utilizaram a abordagem da gestão da mudança no processo de transformação digital
aumentaram a produtividade corporativa. No mesmo sentido, o aluno pode tomar como base o estudo
realizado por Comuzzi e Parhizkar (2017) e propor uma metodologia para que as empresas possam lidar
melhor com as mudanças pós-implementação de sistemas corporativos. No TCC também é possível
mapear o estágio atual da gestão da mudança, com a finalidade de propor uma metodologia para
gerenciamento desta transformação, para posteriormente aplicá-la em uma empresa, ou seja, realizar

11
R. B. dos Santos e F. Vasconcelos

um estudo de caso. Outras pesquisas têm analisado o papel da liderança na gestão da mudança na
era digital, como, por exemplo, Sainger (2018) que realizou um estudo para verificar o papel do líder na
transformação digital. O referido autor conclui que o líder é essencial para a gestão da mudança. Caso
pretenda fazer uma pesquisa similar a essa, é possível realizar um estudo de caso, entrevistas ou aplicar
questionário de forma a verificar qual o papel do líder no processo de transformação digital. Nessa
proposta, é importante o alinhamento entre orientador e aluno quanto à necessidade de passar pelo
Comitê de Ética, dada a temática.

Referências
Chernyak-Hai, L.; Rabenu, E. 2018. The new era workplace relationships: Is social exchange theory still relevant?
Industrial and Organizational Psychology, 11(3): 456-481. Disponível em: <https://www.cambridge.org/core/
journals/industrial-and-organizational-psychology/article/new-era-workplace-relationships-is-social-exchange-
theory-still-relevant/F4E7EA06887C7CD12A3BF6F038D88CE6>. Acesso em: 28 mar. 2021.

Comuzzi, M.; Parhizkar, M. 2017. A methodology for enterprise systems post-implementation change
management. Industrial Management & Data Systems, 117(10): 2241-2262. Disponível em: <https://www.
emerald.com/insight/content/doi/10.1108/IMDS-11-2016-0506/full/html?casa_token=hJ7uKzeCl6wAAAAA:iJUO
xlUczqBQZa67drr_9NpDJxZF7q9Th6MV7Xjloy2-WItbdDNx9u6ynCi6M9NC2sHKuIkjwS3lbiA6WQMPXGCZ3h79x
P4vphewbG-WAiOEc7KQjYw>. Acesso em: 28 mar. 2021.

Goran, J.; LaBerge, L.; Srinivasan, R. 2017. Culture for a digital age. McKinsey Quarterly, 3: 56-67. Disponível em:
<https://lediag.net/wp-content/uploads/2018/05/0-Culture-for-a-digital-age.pdf>. Acesso em: 28 mar. 2021.

Lee, S.M.; Trimi, S. 2021. Convergence innovation in the digital age and in the COVID-19 pandemic crisis. Journal
of Business Research, 123(1): 14-22. Disponível em: <https://www.sciencedirect.com/science/article/pii/
S0148296320306226?casa_token=at8Hux18R_MAAAAA:h4lUoJZBkFs6hwxURbffvBfwB72yXQFCGaqv-
asjSSwheygkH9fU6rnSd_1_VCYCnwN3uRIouw>. Acesso em: 28 mar. 2021.

Sainger, G. 2018. Leadership in digital age: A study on the role of leader in this era of digital
transformation. International Journal on Leadership, 6(1): 1-6. Disponível em: <http://www.
publishingindia.com/ijl/60/leadership-in-digital-age-a-study-on-the-role-of-leader-in-this-era-of-digital-
transformation/684/4784/>. Acesso em: 28 mar. 2021.

Steenkamp, J.B.E. 2020. Global brand building and management in the digital age. Journal of International
Marketing, 28(1): 13-27. Disponível em: <https://journals.sagepub.com/doi/full/10.1177/1069031X19894946>.
Acesso em: 28 mar. 2021.

1.6. Gestão de Equipes em Projetos de Data Science


Cada vez mais as empresas têm entendido a importância de utilizar dados no processo de tomada
de decisão, porém um dos desafios é conscientizar as pessoas sobre isso. Assim, o aluno no TCC pode
realizar entrevistas ou aplicar questionários com o objetivo de apurar como as empresas fazem a gestão
de equipes em projetos de "data science". Outra ideia de pesquisa seria mapear quais são os desafios
de gestão que as empresas enfrentam ao utilizar Data Science e Analytics para a tomada de decisão.
O pesquisador pode, por exemplo, tomar como base o estudo realizado por Vidgen et al. (2017), no
qual foram investigados os desafios enfrentados por gestores organizacionais que buscam se tornar
mais orientados a dados e informações para criar valor. Alguns estudos propõem maneiras de como
as empresas podem fazer a gestão de equipes em projetos de Data Science. McDavid et al. (2020)
propuseram oito práticas de gestão para equipes de data science. Similarmente, é possível realizar um
estudo de caso para mapear como determinada empresa realiza a gestão de equipes de Data Science, a
fim de verificar quais os resultados que ela tem obtido, bem como para propor as melhores práticas, no
sentido de conseguir reduzir a barreira de colaboração interdisciplinar nos projetos da área.

Referências
Assunção, M.A. 2020. Como ser um líder em um novo cenário? Revista Processus de Estudos de Gestão,
Jurídicos e Financeiros, 11(41): 76-87. Disponível em: <http://periodicos.processus.com.br/index.php/egjf/
article/view/239>. Acesso em: 28 mar. 2021.

12
TCC em Data Science e Analytics: áreas e linhas de pesquisa

Iskamto, D. 2020. The Role of Leadership and Influence on Employee Performance in Digital Era. Journal
Manajemen Bisnis, 17(4): 470-484. Disponível em: <http://journal.undiknas.ac.id/index.php/magister-
manajemen/article/view/2730>. Acesso em: 28 mar. 2021.

McDavid, A.; Corbett, A.M.; Dutra, J.L.; Straw, A.G.; Topham, D.J.; Pryhuber, G.S.; Holden-Wiltse, J. 2020.
Eight practices for data management to enable team data science. Journal of Clinical and Translational
Science, 1(1): 1-7. Disponível em: <https://www.cambridge.org/core/journals/journal-of-clinical-and-
translational-science/article/eight-practices-for-data-management-to-enable-team-data-science/
E50F7A75DEDC701C3FEC1819D0DB314D>. Acesso em: 28 mar. 2021.

Mihai, R.L.; Creţu, A. 2019. Leadership in the digital era. Valahian Journal of Economic Studies, 10(1): 65-72.
Disponível em: <https://www.researchgate.net/profile/Roxana-Mihai-2/publication/336984932_Leadership_in_
the_Digital_Era/links/5ea86aa492851cb26760bae5/Leadership-in-the-Digital-Era.pdf>. Acesso em: 28 mar. 2021.

Tonidandel, S.; King, E.B.; Cortina, J.M. 2018. Big data methods: Leveraging modern data analytic techniques to
build organizational science. Organizational Research Methods, 21(3): 525-547. Disponível em: <https://journals.
sagepub.com/doi/full/10.1177/1094428116677299?casa_token=w1zM-QSpEucAAAAA%3ATHk49X3pVcLE7pzMo
O4Pf-QYbONNmjGA6QRZ5HMTp8dYgIS73e4jZPVVb0yXsFiITUTfyQZy34Bl>. Acesso em: 28 mar. 2021.

Vidgen, R.; Shaw, S.; Grant, D.B. 2017. Management challenges in creating value from business
analytics. European Journal of Operational Research, 261(2): 626-639. Disponível em: <https://www.
sciencedirect.com/science/article/pii/S0377221717301455?casa_token=4j3DdxpTGjgAAAAA:WCkbpokbjhNA-
ooIhpquwL6KTA0fSun2eGvHCVaYpRjZA_mlXkBqtEjaxqM-IT-mSoeb6P-q_A>. Acesso em: 28 mar. 2021.

1.7. Gestão da Inovação em Operações e Serviços


A gestão de operações e serviços envolve um conjunto de atividades que transformam insumos em
bens e serviços que os consumidores demandam. Desta forma, o aluno pode analisar no TCC a gestão da
inovação de Produtos e Processos na perspectiva de um determinado nicho de conhecimento, como da
Gestão Ambiental, por exemplo. Neste sentido, o estudo realizado por Theis e Schreiber (2017), no qual eles
conciliaram as atividades de inovação de produtos e processos com os princípios estruturantes (dimensões
social, ambiental e econômica) da gestão ambiental serviria como parâmetro inicial para novos estudos sobre
o tema de gestão da inovação e operações e serviços. Através da aplicação de questionário com o objetivo de
verificar como as empresas consideram a gestão ambiental na gestão da inovação em operações e serviços.
Esse tipo de mapeamento será útil para compreender se a gestão ambiental é um fator que as empresas
brasileiras têm considerado ou não em seu portfólio de operações e serviços, e na gestão da inovação. Por
outra perspectiva, a pesquisa elaborada por Grützmann et al. (2019) na qual eles analisaram como o uso de
tecnologias internet pode apoiar inovação de produtos em empresas brasileiras seria uma direção boa para
novos estudos, mediante aplicação de um questionário com o intuito de mapear as formas que as empresas
têm utilizado a internet e o Data Science neste processo de gestão da inovação em operações e serviços.

Referências
Das, P.; Verburg, R.; Verbraeck, A.; Bonebakker, L. 2018. Barriers to innovation within large financial services
firms. European Journal of Innovation Management, 21(1): 96-112. Disponível em: <https://www.emerald.com/
insight/content/doi/10.1108/EJIM-03-2017-0028/full/html>. Acesso em: 28 mar. 2021.

Grützmann, A.; Zambalde, A.L.; Bermejo, P.H.D.S. 2019. Inovação, Desenvolvimento de Novos Produtos
e as Tecnologias Internet: estudo em empresas brasileiras. Gestão & Produção, 26(1): 1-15. Disponível
em: <https://www.scielo.br/scielo.php?pid=S0104-530X2019000100216&script=sci_arttext&tlng=pt>.
Acesso em: 28 mar. 2021.

Kitsuta, C.M.; Quadros, R. 2019. Gestão da inovação em empresas brasileiras de serviços de tecnologia
da informação: modelos de inovação planejada, de aplicação rápida e de inovação deliberada a
posteriori. Cadernos EBAPE, 17(4): 1048-1061. Disponível em: <https://www.scielo.br/scielo.php?pid=S1679-
39512019000401048&script=sci_arttext>. Acesso em: 28 mar. 2021.

Moya, C.A.; Boly, V.; Morel, L.; Gálvez, D.; Camargo, M. 2020. Characterization of Best Practices for Customer/
Supplier Collaboration in Co-innovation Projects. Journal of technology management & innovation, 15(4):

13
R. B. dos Santos e F. Vasconcelos

5-18. Disponível em: <https://scielo.conicyt.cl/scielo.php?pid=S0718-27242020000400005&script=sci_


arttext&tlng=n>. Acesso em: 28 mar. 2021.

Theis, V.; Schreiber, D. 2017. Inovação de produtos e processos sob a perspectiva da gestão ambiental. Revista
de Ciências da Administração, 1(1): 94-113. Disponível em: <https://periodicos.ufsc.br/index.php/adm/article/
view/2175-8077.2017v19n47p94>. Acesso em: 28 mar. 2021.

1.8. Legislação no Ambiente Digital e LGPD


Com o advento da Era Digital houve a necessidade de a legislação acompanhar a nova realidade de
forma a regular as relações modificadas pelas novas tecnologias. A Lei Geral de Proteção de Dados [LGPD]
tem como objetivo garantir a transparência no uso de dados pessoais. Portanto, uma ideia de pesquisa
para o TCC seria verificar os impactos da LGPD nos negócios, como fez Santos (2019) em seu estudo. Desta
forma, o aluno tem a possibilidade no seu TCC de verificar por meio de um questionário os impactos da
LGPD nos negócios de várias empresas ou escolher somente uma para fazer um estudo de caso, para
compreender os impactos da LGPD em determinada organização. Especialmente, seria possível verificar
no estudo proposto se a LGPD afetou as práticas de governança, bem ainda se as empresas passaram a
ter mais cuidado no tratamento dos dados dos seus clientes. Outras pesquisas têm investigado o impacto
da LGPD, especificamente, sobre os negócios digitais. De acordo com Menegazzi et al. (2019), o escândalo
da empresa Cambrige Analytica® envolvendo a rede social Facebook, com vazamento de dados de milhões
de usuários, impulsionou o Brasil a sancionar a lei de proteção de dados. Outro tema seria verificar
como a LGPD afeta os custos dos negócios digitais. Assim, seria possível realizar uma pesquisa com uma
empresa que tem negócios digitais e que passou por algum escândalo de vazamento de informações de
seus clientes, de forma a verificar como ela conseguiu superar este problema e quais foram as medidas
de prevenção que ela passou a tomar para evitar novos situações arriscadas relacionados com o tema
proteção de dados.

Referências
Hemdan, E.E.D.; Manjaiah, D.H. 2021. An efficient digital forensic model for cybercrimes investigation in
cloud computing. Multimedia Tools and Applications, 1(1): 1-28. Disponível em: <https://link.springer.com/
article/10.1007/s11042-020-10358-x>. Acesso em: 28 mar. 2021.

Mendes, L.S. 2018. O diálogo entre o Marco Civil da Internet e o Código de Defesa do Consumidor. Revista de
Direito do Consumido, 106(25): 37-69. Disponível em: <https://revistadedireitodoconsumidor.emnuvens.com.
br/rdc/article/view/77>. Acesso em: 28 mar. 2021.

Menegazzi, D.; Matte, J.; Saraiva, I.Z. 2019. O Impacto da Lei Geral de Proteção de Dados Sobre os Negócios
Digitais. Caderno de Propriedade Intelectual e Transferência de Tecnologia, 1(1): 33-36. Disponível em: <https://
publicacoes.ifc.edu.br/index.php/CPITT/article/view/1273>. Acesso em: 28 mar. 2021.

Piurcosky, F.P.; Costa, M.A; Frogeri, R.F.; Leal Calegario, C.L. 2019. A lei geral de proteção de dados pessoais em
empresas brasileiras: uma análise de múltiplos casos. Suma de Negócios, 10(23): 89-99. Disponível em: <http://www.
scielo.org.co/scielo.php?pid=S2215-910X2019000300089&script=sci_abstract&tlng=en>. Acesso em: 28 mar. 2021.

Raposo, C.F.L.; Lima, H.M.; Oliveira Junior, W.F.; Silva, P.A.F.; Souza Barros, E.E. 2019. LGPD-Lei Geral de Proteção
de Dados Pessoais em Tecnologia da Informação: Revisão Sistemática. RACE - Revista de Administração
do Cesmac, 4(1): 58-67. Disponível em: <https://revistas.cesmac.edu.br/index.php/administracao/article/
view/1035>. Acesso em: 28 mar. 2021.

Santos, N.A. 2019. LGPD: Lei geral de proteção de dados pessoais e seus reflexos empresariais. Anais do
EVINCI – UniBrasil, 5(1): 142-142. Disponível em: <https://portaldeperiodicos.unibrasil.com.br/index.php/
anaisevinci/article/view/4852>. Acesso em: 28 mar. 2021.

2. Automação e Strategic Analytics


Nos últimos anos, o desenvolvimento da automação alinhada à "Strategic Analytics" trouxe diversos
benefícios, inclusive para a gestão de negócios. Com adoção desse modelo de estratégia, foi possível

14
TCC em Data Science e Analytics: áreas e linhas de pesquisa

aumentar a produtividade das empresas e ter mais informações para a tomada de decisão mais
assertiva. A seguir, serão apresentados alguns subtópicos de pesquisa que podem ser utilizados para o
desenvolvimento de TCC nesta temática.

2.1. Tecnologia da Informação [TI] e Inovação Tecnológica


A Tecnologia da Informação tem possibilitado que haja inovação tecnológica ao permitir a
automação dos processos de forma inovadora. Uma ideia de pesquisa para o TCC é verificar quais os
ganhos que as empresas obtêm ao adotarem novas tecnologias digitais, como no estudo realizado por
Mendonça et al. (2009), em que eles mensuraram os impactos decorrentes da adoção de tecnologia
da informação na produtividade dos trabalhadores da indústria de transformação brasileira, mediante
a coleta de dados de algumas bases para a realização desta pesquisa, tais como: Pesquisa Industrial
Anual [PIA] e da Pesquisa Industrial de Inovação Tecnológica [PINTEC] ambas do Instituto Brasileiro de
Geografia e Estatística [IBGE], da Relação Anual de Informações Sociais [RAIS] do Ministério do Trabalho
e Emprego [MTE] e da Secretaria de Comércio Exterior [SECEX] do Ministério de Desenvolvimento,
Indústria e Comércio Exterior [MDIC]. Outra ideia de pesquisa seria apurar se a pandemia da COVID-19
afetou a produtividade das empresas e qual influência teve a tecnologia de informação e a inovação
neste contexto. Além disso, o aluno poderia, em seu TCC, verificar o papel da Tecnologia da Informação
(TI) na transformação digital, por meio da aplicação de questionário ou realização de entrevistas com o
objetivo de verificar como a TI tem auxiliado as empresas neste processo.

Referências
Brito, R.P.D.; Brito, L.A.L. 2012. Vantagem competitiva e sua relação com o desempenho: uma abordagem
baseada em valor. Revista de Administração Contemporânea, 16(3): 360-380. Disponível em: <https://www.
scielo.br/scielo.php?pid=S1415-65552012000300003&script=sci_arttext&tlng=pt>. Acesso em: 12 mar. 2021.

Esch, C.E.; Carvalho, M.M. 2016. Os desafios de gestão para a incorporação de novas tecnologias digitais nos
serviços públicos de radiodifusão do Brasil e de Portugal. Comunicação e Sociedade, 30: 119-136. Disponível
em: <https://revistacomsoc.pt/article/view/810>. Acesso em: 12 mar. 2021.

Lima, A.G.; Pinto, G.S. 2019. Indústria 4.0: um novo paradigma para a indústria. Revista Interface Tecnológica,
16(2): 299-311. Disponível em: <https://revista.fatectq.edu.br/index.php/interfacetecnologica/article/view/642>.
Acesso em: 12 mar. 2021.

Massaro, A.; Galiano, A. 2020. Re-engineering process in a food factory: an overview of technologies and
approaches for the design of pasta production processes. Production & Manufacturing Research, 8(1):
80-100. Disponível em: <https://www.tandfonline.com/doi/full/10.1080/21693277.2020.1749180>. Acesso
em: 12 mar. 2021.

Mendonça, M.A.A.D.; Freitas, F.D.A.; Souza, J.M.D. 2009. Tecnologia da informação e produtividade na indústria
brasileira. Revista de Administração de Empresas, 49(1): 74-85. Disponível em: <https://www.scielo.br/scielo.
php?pid=S0034-75902009000100009&script=sci_arttext>. Acesso em: 12 mar. 2021.

Souza, M.A.R.; Souza, P.C.P.C.; Nogueira, R.R. 2014. Adoção de inovações em mercados em rede: uma análise da
introdução do livro didático digital no Brasil. RAI Revista de Administração e Inovação, 11(4): 159-192. Disponível
em: <https://www.sciencedirect.com/science/article/pii/S1809203916302017>. Acesso em: 12 mar. 2021.

2.2. Big Data e o Processo de Tomada de Decisão


Uma das demandas recentes na gestão dos negócios é a utilização de Big Data no processo de
tomada de decisão. Assim, o aluno pode em seu TCC verificar como as empresas têm utilizado Big Data
no processo de tomada de decisão ou mapear quais foram os ganhos que as empresas obtiveram
ao decidirem utilizar essa ferramenta na gestão dos seus negócios. No mesmo sentido, seria possível
verificar se as empresas após utilizarem Big Data aumentaram a velocidade do processo de tomada de
decisão. Outro exemplo consiste na pesquisa de Mikalef et al. (2019) que investigou, mediante a utilização
de um questionário, como a utilização de Big Data pode aumentar o desempenho e a produtividade das

15
R. B. dos Santos e F. Vasconcelos

empresas. Similarmente, o aluno poderia aplicar questionários para verificar quais foram os ganhos que
as empresas obtiveram com a utilização de Big Data em determinado contexto. Além disso, também
haveria a possibilidade de mapear quais os principais desafios que as empresas enfrentaram para
adicionar aos seus processos a utilização da ferramenta Big Data.

Referências
Castro, J.P.C.; Carniel, A.C; Ciferri, C.D.A. 2020. Analyzing spatial analytics systems based on Hadoop and Spark:
A user perspective. Software. Practice and Experience, 50(12): 2121-2144. Disponível em: <https://onlinelibrary.
wiley.com/doi/full/10.1002/spe.2882?casa_token=46ibXFHFFC0AAAAA%3AIJ0QdWAsMX_4paH5R74pXrNwEyZk
WgpPy48k5A2LEZUq3oa-KbLEsRkUoXyVbmr4AzPx1gGGXbehmiU>. Acesso em: 12 mar. 2021.

Kelling, S.; Fink, D.; La Sorte, F.A.; Johnston, A.; Bruns, N.E.; Hochachka, W.M. 2015. Taking a ‘Big Data’ approach
to data quality in a citizen science project. Ambio, 44(4): 601-611. Disponível em: <https://link.springer.com/
article/10.1007/s13280-015-0710-4. Acesso em: 12 mar. 2021.

Mikalef, P.; Boura, M.; Lekakos, G.; Krogstie, J. 2019. Big data analytics and firm performance: Findings from
a mixed-method approach. Journal of Business Research, 98(1): 261-276. Disponível em: <https://www.
sciencedirect.com/science/article/pii/S014829631930061X>. Acesso em: 12 mar. 2021.

Nasser, T.; Tariq, R.S. 2015. Big data challenges. J Comput Eng Inf Technol, 4(3): 1-11. Disponível em:
<https://www.researchgate.net/profile/Tariq-Soomro-2/publication/282281171_Big_Data_Challenges/
links/560a53c908ae4d86bb137402/Big-Data-Challenges.pdf>. Acesso em: 12 mar. 2021.

Silveira, M.; Marcolin, C.B.; Freitas, H.M.R. 2015. Uso corporativo do Big Data: Uma revisão de literatura. Revista
de Gestão e Projetos, 6(3): 44-59. Disponível em: <https://periodicos.uninove.br/gep/article/view/9627>. Acesso
em: 12 mar. 2021.

2.3. Inteligência Artificial


Nos últimos anos, dois termos têm sido utilizados amplamente: Big Data e Inteligência Artificial.
Isso porque eles têm revolucionado o mundo dos negócios ao utilizarem números, dados e algoritmos
que auxiliam na tomada de decisão de forma mais assertiva. Desta forma, o aluno poderia realizar
em seu TCC uma pesquisa para verificar a relação entre Big Data e Inteligência Artificial, tendo como
referência o estudo realizado por Mihet e Philippon (2019), no qual eles analisaram a expansão das
tecnologias de Big Data e Inteligência Artificial na gestão dos negócios. Na oportunidade, os referidos
autores concluíram que as novas tecnologias têm afetado tanto empresas quanto consumidores, além
de questões relacionadas à produtividade e competitividade. Assim, um estudo de caso de uma empresa
que utiliza Big Data e inteligência artificial seria viável de forma a verificar quais foram os benefícios
que ela obteve ao combinar essas duas tecnologias, inclusive em contextos específicos como na gestão
dos recursos humanos, finanças ou marketing. Como exemplo citamos o estudo realizado por Tambe
et al. (2019), no qual eles identificaram quatro desafios no uso da inteligência artificial para as tarefas
de RH: complexidade dos fenômenos de RH, restrições impostas por pequenos conjuntos de dados,
questões de responsabilidade associadas à justiça e outras restrições éticas e legais e possíveis reações
adversas dos funcionários às decisões de gestão via dados algoritmos. Pesquisa semelhante no TCC
seria interessante, mediante aplicação de questionário ou realização de entrevistas, para verificar como
as empresas utilizam inteligência artificial nos seus mais diversos setores e quais são os seus impactos
nos processos de negócio.

Referências
Ferreira, R.; Gomes, J.S. 2019. Projetos de Big Data Analytics: uma discussão à luz da Capacidade
Absortiva. Sustainable Business International Journal, (85):1-30. Disponível em: <https://periodicos.uff.br/
sbijournal/article/view/28905>. Acesso em: 12 mar. 2021.

Ferreira, R.; Gomes, J.S.; Carvalho, A. 2020. Capacidade absortiva em implementações de analytics: um modelo
de pesquisa. RAM - Revista de Administração Mackenzie, 21(2): 1-28. Disponível em: <https://www.scielo.br/
scielo.php?pid=S1678-69712020000200201&script=sci_arttext&tlng=pt>. Acesso em: 12 mar. 2021.

16
TCC em Data Science e Analytics: áreas e linhas de pesquisa

Koehler, J. 2018. Business process innovation with artificial intelligence: levering benefits and controlling
operational risks. European Business and Management, 4(2): 55-66. Disponível em: <https://jana-koehler.dfki.
de/docs/bpi-ai2018.pdf>. Acesso em: 12 mar. 2021.

Mihet, R.; Philippon, T. 2019. The economics of Big Data and artificial intelligence. In: Disruptive Innovation in
Business and Finance in the Digital World. International Finance Review. Disponível em: <https://www.emerald.
com/insight/content/doi/10.1108/S1569-376720190000020006/full/html>. Acesso em: 12 mar. 2021.

Motta, F.M.D.V.; Barbosa, C.R.; Barbosa, R.R. 2019. Big Data como Fonte de Inovação em Museus: o estudo de
caso do Museu Britânico. Informação & Sociedade: Estudos, 29(1): 83-100. Disponível em: <https://brapci.inf.
br/index.php/res/v/111788>. Acesso em: 12 mar. 2021.

Vrontis, D.; Christofi, M.; Pereira, V.; Tarba, S.; Makrides, A.; Trichina, E. 2021. Artificial intelligence, robotics,
advanced technologies and human resource management: a systematic review. The International Journal of
Human Resource Management, 1(1): 1-30. Disponível em: <https://www.tandfonline.com/doi/abs/10.1080/095
85192.2020.1871398>. Acesso em: 12 mar. 2021.

2.4. Sistemas de Suporte à Decisão e Data Mining


Cada vez mais as organizações têm utilizado o Data Mining nos sistemas de suporte à decisão.
A referida ferramenta é útil para fazer classificações de forma a transformar os dados coletados em
informações importantes para a tomada de decisão. Desta forma, a realização de uma pesquisa com
o objetivo de analisar se as empresas utilizam Data Mining no processo de gerar informação para a
tomada de decisão, com mensuração dos seus impactos nos negócios, seria bastante interessante.
É possível tomar como base o estudo realizado por Mosavi (2014), no qual foi aplicado o conceito de
Data Mining no processo de decisão em um projeto de otimização na área da engenharia. Além disso,
a realização de uma pesquisa comparando duas empresas e seus resultados, sendo que uma utiliza
algum framework de Big Data e outra não, seria uma temática interessante para um TCC. A partir dos
resultados obtidos desta comparação, será possível apurar se a utilização de uma ferramenta de Big
Data traz algum benefício real para as empresas ou não. Um bom referencial teórico para servir de
base para um estudo sobre o tema foi realizado por Rehman et al. (2016), quando foi pesquisado se um
framework de Big Data é capaz de criar valor em empresas sustentáveis. Tal temática também traria
vários insights para estudos visando a elaboração de um TCC.

Referências
Balachandran, B.M.; Prasad, S. 2017. Challenges and benefits of deploying big data analytics in the cloud
for business intelligence. Procedia Computer Science, 112(1): 1112-1122. Disponível em: <https://www.
sciencedirect.com/science/article/pii/S1877050917314953>. Acesso em: 12 mar. 2021.

Manogaran, G.; Lopez, D. 2018. A Gaussian process based big data processing framework in cluster computing
environment. Cluster Computing, 21(1): 189-204. Disponível em: <https://link.springer.com/article/10.1007/
s10586-017-0982-5>. Acesso em: 12 mar. 2021.

Mosavi, A. 2014. Data mining for decision making in engineering optimal design. Journal of AI and Data
Mining, 2(1): 7-14. Disponível em: <http://jad.shahroodut.ac.ir/article_125_0.html>. Acesso em: 12 mar. 2021.

Osman, A.M.S. 2019. A novel big data analytics framework for smart cities. Future Generation
Computer Systems, 91(1): 620-633. Disponível em: <https://www.sciencedirect.com/science/article/
pii/S0167739X17307446?casa_token=DGjHxE5-wrsAAAAA:q5Crs7R74IkIijf7xox8ZbLV2Emc-2_
FHGhDUpFvhI97vsS51ivQIw0tIss84YGQ911HmAe9RQ>. Acesso em: 12 mar. 2021.

ur. Rehman, M.H., Chang, V.; Batool, A.; Wah, T.Y. 2016. Big data reduction framework for value creation
in sustainable enterprises. International Journal of Information Management, 36(6): 917-928. Disponível
em: <https://www.sciencedirect.com/science/article/pii/S0268401216303097?casa_token=ahzAX6vw_
i0AAAAA:887c5e_VJTo5kG8bGVsXMwDPptGxmz4MPLB0nXvrHW5tDRCZ_h3mG8ylATEOQ2d0RsNhE6QH-g>.
Acesso em: 12 mar. 2021.

Zhang, Y.; Ren, S.; Liu, Y.; Sakao, T.; Huisingh, D. 2017. A framework for Big Data
driven product lifecycle management. Journal of Cleaner Production, 159(1):
229-240. Disponível em: <https://www.sciencedirect.com/science/article/pii/

17
R. B. dos Santos e F. Vasconcelos

S0959652617309150?casa_token=4bMCASrB9XYAAAAA:FjmdTwpNqpWDrjE_VW8YMWqvelfcAd7TP-MnVlpIfn
ZeF4AHrIbRsH6FSjHONukNt8A4kNo8Sg>. Acesso em: 12 mar. 2021.

2.5. Governança de Dados e Gestão de Dados


Com o surgimento do Big Data veio também a preocupação das empresas relacionadas à proteção
dos seus dados e dos seus clientes. Assim, surgiu a governança de dados que busca capacitar as
empresas, por meio de recursos e ferramentas, para que elas possam administrar suas informações de
forma segura. A realização de uma pesquisa para verificar como as empresas fazem a sua governança
e gestão de dados seria um bom tema para TCC. O aluno também poderia propor um framework
de governança de dados para um determinado setor, como realizado no estudo promovido por Al-
Badi et al. (2018), quando foi proposto um framework para a governança de dados com base em
oito componentes, através de uma comparação com modelo indicado pela ISO8000. Além disso, seria
possível desenvolver um TCC através de estudo de caso específico que proponha as melhores práticas
de governança de dados, inclusive com sua aplicação em uma determinada empresa. A gestão de
qualidade no contexto de Big Data também seria um tema interessante para ser desenvolvido em um
trabalho de TCC, tomando como ponto de partida a pesquisa realizada por Merino et al. (2016), em que
os autores propuseram o modelo dos 3 A’s do Data Quality-in-Use: Adequação Contextual, Adequação
Operacional e Adequação Temporal.

Referências
Al-Badi, A.; Tarhini, A.; Khan, A.I. 2018. Exploring big data governance frameworks. Procedia Computer
Science, 141(1): 271-277. Disponível em: <https://www.sciencedirect.com/science/article/pii/
S1877050918318313>. Acesso em: 12 mar. 2021.

Almeida, B.D.A.; Doneda, D.; Ichihara, M.Y.; Barral-Netto, M.; Matta, G.C.; Rabello, E.T.; Barreto, M. 2020.
Preservação da privacidade no enfrentamento da COVID-19: dados pessoais e a pandemia global. Ciência &
Saúde Coletiva, 25(1): 2487-2492. Disponível em: <https://www.scielosp.org/article/csc/2020.v25suppl1/2487-
2492/>. Acesso em: 12 mar. 2021.

Bertin, P.R.B.; Fortaleza, J.M.; Silva, A.C.; Okawachi, M.F.; Cardoso, M.O. 2019. A política de governança de
dados, informação e conhecimento da Embrapa como mecanismo para a gestão de dados de pesquisa
agropecuários. Liinc em Revista, 15(2): 194-204. Disponível em: <http://revista.ibict.br/liinc/article/view/4798>.
Acesso em: 12 mar. 2021.

Firmani, D.; Mecella, M.; Scannapieco, M.; Batini, C. 2016. On the meaningfulness of “big data quality”. Data
Science and Engineering, 1(1): 6-20. Disponível em: <https://link.springer.com/content/pdf/10.1007/s41019-
015-0004-7.pdf>. Acesso em: 12 mar. 2021.

Kovacova, M.; Kliestik, T.; Pera, A.; Grecu, I.; Grecu, G. 2019. Big data governance of automated algorithmic
decision-making processes. Review of Contemporary Philosophy, 18(1): 126-132. Disponível em: <https://www.
ceeol.com/search/article-detail?id=790957>. Acesso em: 12 mar. 2021.

Merino, J.; Caballero, I.; Rivas, B.; Serrano, M.; Piattini, M. 2016. A data quality in use model for big data. Future
Generation Computer Systems, 63(1): 123-130. Disponível em: <https://www.sciencedirect.com/science/article/
pii/S0167739X15003817?casa_token=loQlUeM1wbcAAAAA:C6tFRV1IV7n7cLI5QKxddlu-hahm1may7WHNwa72
yLL1K6EKZYekRQ5LUgXzSDwID7Z_2roIfQ>. Acesso em: 12 mar. 2021.

2.6. Segurança de Dados e Cyber Security


Os últimos incidentes de ataques cibernéticos ou vazamento de informações têm mostrado
a importância da segurança dos dados e da Cyber Security. A Cyber Security refere-se à prática que
busca proteger os computadores e os servidores, sistemas eletrônicos, redes e dados contra os ataques
cibernéticos. Assim, verificar mediante aplicação de um questionário ou entrevistas se as empresas têm
investido em segurança de dados e seus processos, também é um tema interessante para construção
de um TCC. Outra ideia de pesquisa é realizar um estudo de caso com uma empresa que investe em
segurança de informação e verificar a importância de ter uma política de Cyber Security na empresa.
Uma referência cativante sobre o tema foi a pesquisa realizada por Wiant (2005), na qual o autor avaliou
a utilidade de ter uma política de Cyber Security ao analisar os relatos de incidentes de segurança da

18
TCC em Data Science e Analytics: áreas e linhas de pesquisa

informação. Outra ideia de pesquisa que o aluno pode considerar em seu TCC é verificar por meio de
entrevistas, questionário ou mesmo um estudo de caso, como as empresas lidam com os incidentes de
segurança da informação. A verificação da relação entre a Cyber Security e Big Data também poderia ser
um assunto a ser abordado numa pesquisa de TCC, mediante o levantamento por meio de questionário,
para verificar quais os benefícios que as empresas têm ao utilizar Big Data na segurança da informação.

Referências
Dor, D.; Elovici, Y. 2016. A model of the information security investment decision-making process. Computers
& security, 63(1): 1-13. Disponível em: <https://www.sciencedirect.com/science/article/pii/
S0167404816301043?casa_token=O718aCVH64AAAAAA:26K--IfpE5N-f5uutzJEDb5bj2ifI42zEmj1qpjmAy1O9Kg
M33ICf-jNhx243G8tHNH0bmzETDlz>. Acesso em: 12 mar. 2021.

Everett, C. 2015. Big data–the future of cyber-security or its latest threat? Computer Fraud & Security, 2015(9):
14-17. Disponível em: <https://www.sciencedirect.com/science/article/pii/S1361372315300853?casa_
token=ME8kSgmV9fAAAAAA:fi_Eu6S1iCRDPioFlA_bL1crSPvJg2QOQy-Q2dv8zl2KFtqDzIY4pdGnMoj0WXdtLMSy
zLcGpCv7>. Acesso em: 12 mar. 2021.

Kweon, E.; Lee, H.; Chai, S.; Yoo, K. 2019. The utility of information security training and education on
cybersecurity incidents: an empirical evidence. Information Systems Frontiers, 1(1): 1-13. Disponível em:
<https://link.springer.com/content/pdf/10.1007/s10796-019-09977-z.pdf>. Acesso em: 12 mar. 2021.

Sarker, I.H.; Kayes, A.S.M.; Badsha, S.; Alqahtani, H.; Watters, P.; Ng, A. 2020. Cybersecurity data science: an
overview from machine learning perspective. Journal of Big Data, 7(1): 1-29. Disponível em: <https://link.
springer.com/article/10.1186/s40537-020-00318-5>. Acesso em: 12 mar. 2021.

Siponen, M.; Willison, R. 2009. Information security management standards: Problems and
solutions. Information & management, 46(5): 267-270. Disponível em: <https://www.sciencedirect.com/
science/article/pii/S0378720609000561?casa_token=enwsb8eVpsYAAAAA:2fP38tx0miqslmaow3hblHAfg_
RECoZ2ut9YQeQB-e3s-A7nOR_S3ObeITUZWtHdEiXOOy0Dkr8>. Acesso em: 12 mar. 2021.

Wiant, T.L. 2005. Information security policy’s impact on reporting security incidents. Computers
& security, 24(6): 448-459. Disponível em: <https://www.sciencedirect.com/science/article/pii/
S0167404805000490?casa_token=0iPZyH0TgbUAAAAA:vC44p3awqIxVCb6XpwHF13nWzgfOJywKcmIJxseyMTih
IGKM-0g82GcI8Crvai1RuEXdvkuMHBJj>. Acesso em: 12 mar. 2021.

2.7. Business Intelligence e Data Visualization


O Business Intelligence refere-se ao processo de coletar, organizar, analisar, compartilhar e monitorar
as informações que oferecem suporte ao processo de tomada de decisão. Por outro lado, a visualização
de dados envolve a representação gráfica dos dados e das informações. Uma das combinações que
têm crescido nos últimos anos é exatamente dessas duas ferramentas de Business Intelligence e Data
Visualization. Desta forma, o aluno pode, em seu TCC, verificar por meio de questionário se as empresas
utilizam Business Intelligence e Data Visualization na tomada de decisão e quais benefícios que elas
obtiveram ao combinar essas duas ferramentas. Na área de Business Intelligence e Data Visualization
um tópico que tem crescido recentemente é o DataViz Model que pode ser proposto pelo aluno como
um dos temas de pesquisa. Uma referência sobre a temática é o estudo realizado por More et al. (2017),
no qual propuseram um DataViz Model a partir de uma nova abordagem para Big Data Analytics e
Visualização de dados. Similarmente, o aluno tem a possibilidade de abordar, em seu TCC, um modelo
DataViz de determinado setor da economia ou empresa específica. Além disso, o levantamento por
meio de aplicação de questionário para verificar quais as principais ferramentas de Business Intelligence
utilizadas pelas empresas, também seria um tema relevante para um TCC. Por fim, a análise de quais as
principais vantagens e limitações da adoção de um DataViz Model no contexto empresarial poderia ser
abordado como um tema relevante.

Referências
Diamond, M.; Mattia, A. 2017. Data visualization: An exploratory study into the software tools
used by businesses. Journal of Instructional Pedagogies, 1(1): 18, 1-7. Disponível em: <https://eric.
ed.gov/?id=EJ1151731>. Acesso em: 12 mar. 2021.

19
R. B. dos Santos e F. Vasconcelos

Elena, C. 2011. Business intelligence. Journal of Knowledge Management, Economics and


Information Technology, 1(2): 1-12. Disponível em: <http://citeseerx.ist.psu.edu/viewdoc/
download?doi=10.1.1.678.1634&rep=rep1&type=pdf>. Acesso em: 12 mar. 2021.

Gomes, L.F.A.M.; Moreno, A.V.; Woitowicz, B.B.C.; Lucas, S.M.F. 2011. Uma abordagem multicritério para a seleção
de ferramentas de business intelligence. Revista Eletrônica de Sistemas de Informação, 10(2): 1-30. Disponível
em: <http://www.periodicosibepes.org.br/index.php/reinfo/article/view/950>. Acesso em: 12 mar. 2021.

Jourdan, Z.; Rainer, R.K.; Marshall, T.E. 2008. Business intelligence: An analysis of the literature. Information
systems management, 25(2): 121-131. Disponível em: <https://www.tandfonline.com/doi/
abs/10.1080/10580530801941512>. Acesso em: 12 mar. 2021.

More, R.; Goudar, R.H.; More, R. 2017. DataViz model: a novel approach towards big data analytics and
visualization. International Journal of Engineering and Manufacturing (IJEM), 7(6): 43-49. Disponível em: <http://
www.mecs-press.net/ijem/ijem-v7-n6/IJEM-V7-N6-4.pdf>. Acesso em: 12 mar. 2021.

3. Analytics e Machine Learning


Analytics e Machine Learning fazem parte do conjunto de ferramentas de Data Science que as empresas
podem utilizar na gestão dos seus negócios. Analytics busca fazer previsões sobre o futuro com base em
dados do passado, ao obter inferências a partir deles. De acordo com Selwyn (2019), aprender analytics
e suas aplicações é uma das habilidades mais emergentes nos últimos anos. Contudo, ele apresenta
algumas questões importantes para que Analytics seja bem empregado e que podem ser exploradas em
estudos sobre o tema. Por outro lado, Machine Learning é uma tecnologia que utiliza computadores com a
capacidade de aprender por meio da associação de diferentes dados que podem ser imagens, números e
tudo que essa tecnologia possa identificar. Desta forma, cada vez mais as empresas têm entendido que se
elas desejam ter diferencial ou até mesmo sobreviver, elas precisam utilizar tanto ferramentas de Analytics
como de Machine Learning no processo de tomada de decisão. A seguir serão apresentadas algumas
possibilidades de pesquisa nesta linha de pesquisa que o aluno pode considerar em seu TCC.

3.1. Data Wrangling, Datasets e Escalas de Mensuração de Variáveis


O Data Wrangling é uma etapa básica no processo de visualização dos dados, agregação e modelagem
estatística. Já o Dataset é o conjunto de dados que serão utilizados nas análises. No processo de realização
de pesquisas, em alguns casos, é necessário utilizar escalas para mensurar uma determinada variável.
Assim, o aluno em seu TCC pode analisar os objetivos, processos e desafios em Data Analytics que as
empresas têm enfrentado, inclusive para montar os Datasets que serão utilizados para mensuração das
variáveis importantes para seus negócios. Além disso, verificar como as empresas exploram seus dados e
se elas utilizam Data Wrangling nas suas análises, bem como quais foram os benefícios obtidos por meio da
utilização destas ferramentas, são temas interessantes para serem abordados em TCC. As tendências em
Data Wrangling (preparação dos dados) também têm relevância para estudos desta natureza. Por fim, o aluno
pode usar como referência o estudo realizado por Kahn e Jiang (2020), no qual eles mostram como o Data
Wrangling pode ser aplicado em base de dados grandes e complexas. Da mesma forma, é possível construir
este mesmo estudo a partir de dados abertos, como por exemplo, do Instituto Brasileiro de Geografia e
Estatística [IBGE] ou da Comissão de Valores Mobiliários [CVM] para mostrar como e quais os desafios de
aplicar Data Wrangling em bases de dados grandes e complexas, inclusive de fontes governamentais.

Referências
Behrens, J.T.; DiCerbo, K.E.; Yel, N.; Levy, R. 2012. Exploratory data analysis. Handbook of Psychology, Second
Edition, chapter. 2. Disponível em: <https://onlinelibrary.wiley.com/doi/abs/10.1002/9781118133880.
hop202002>. Acesso em: 21 fev. 2021.

Bengio, Y.; Lodi, A.; Prouvost, A. 2020. Machine learning for combinatorial optimization: a methodological
tour d’horizon. European Journal of Operational Research, 290(2): 405-421. Disponível em: <https://www.
sciencedirect.com/science/article/abs/pii/S0377221720306895>. Acesso em: 21 fev. 2021.

20
TCC em Data Science e Analytics: áreas e linhas de pesquisa

Ghosh, A.; Nashaat, M.; Miller, J.; Quader, S.; Marston, C. 2018. A comprehensive review of tools for exploratory
analysis of tabular industrial datasets. Visual Informatics, 2(4): 235-253. Disponível em: <https://www.
sciencedirect.com/science/article/pii/S2468502X18300561>. Acesso em: 21 fev. 2021.

Kahn, J.; Jiang, S. 2020. Learning with large, complex data and visualizations: youth data wrangling in modeling
family migration. Learning, Media and Technology, 1-16. Disponível em: <https://www.tandfonline.com/doi/
abs/10.1080/17439884.2020.1826962?journalCode=cjem20>. Acesso em: 21 fev. 2021.

Kandel, S.; Heer, J.; Plaisant, C.; Kennedy, J.; Van Ham, F.; Riche, N.H.; Weaverm C.; Lee, B.; Brodbeck, D.;
Buono, P. 2011. Research directions in data wrangling: Visualizations and transformations for usable and
credible data. Information Visualization, 10(4): 271-288. Disponível em: <https://journals.sagepub.com/
doi/10.1177/1473871611415994>. Acesso em: 21 fev. 2021.

Selwyn, N. 2019. What’s the problem with learning analytics? Journal of Learning Analytics, 6(3): 11-19.
Disponível em: <https://learning-analytics.info/index.php/JLA/article/view/6386/7308>. Acesso em: 21 fev. 2021.

3.2. Unspervised Machine Learning Techniques


Unspervised Machine Learning Techniques é uma ferramenta de aprendizado de máquina em que
os usuários não precisam supervisionar o modelo. Assim, essa técnica permite que o modelo trabalhe
por conta própria para descobrir padrões e informações que não foram detectados anteriormente.
Desta forma, o pesquisador tem a possibilidade de mapear por meio de questionário se as empresas
utilizam Unspervised Machine Learning Techniques na gestão de seus negócios, quais os benefícios de
utilizar estas técnicas e quais foram os desafios que elas enfrentaram para implementá-las. Também é
possível identificar, mediante um estudo, quais as empresas que utilizam Unspervised Machine Learning
Techniques combinadas com Tools for Exploratory Analysis (ferramentas para análise exploratória),
bem como se elas percebem agregação real de valor ao processo de tomada de decisão com uso
dessas técnicas. A pesquisa realizada por Qin et al. (2020) pode ser utilizada como referencial teórico
na elaboração de um TCC, pois neste estudo eles mostram que a visualização de dados é uma das
demandas mais atuais na condução dos negócios, além de apresentarem as principais ferramentas que
tornam a visualização de dados mais eficiente. Desta forma, em seu TCC, o aluno tem a possibilidade
de aplicar questionário ou realizar entrevistas para verificar quais são as ferramentas de visualização
de dados mais utilizadas na gestão dos negócios pelas empresas. Outra ideia de pesquisa é verificar
possíveis maneiras de lidar com o problema de “Missing Value” (dado faltante) numa base de dados
utilizando técnicas de Unsupervised Machine Learning (aprendizado de máquina não supervisionado).
Assim, o aluno pode tomar como referência o estudo realizado por Raja e Thangavel (2020), no qual eles
utilizaram abordagens de computação flexível para lidar com valores ausentes por meio da utilização de
técnicas de aprendizado de máquina não supervisionadas. É possível replicar este mesmo estudo em
grandes bases de dados abertas, por exemplo, do IBGE, mediante aplicação de Unsupervised Machine
Learning para verificar quais foram os ganhos obtidos no tratamento dos Missing Values.

Referências
Fávero, L.P.; Belfiore, P. 2017. Manual de análise de dados. Elsevier, Rio de Janeiro, RJ, Brasil.

Fávero, L.P.; Belfiore, P. 2019. Data science for business and decision making. Academic Press, Cambridge, UK.

Qin, X.; Luo, Y.; Tang, N.; Li, G. 2020. Making data visualization more efficient and effective: a survey. The VLDB
Journal, 29(1): 93-117. Disponível em: <https://link.springer.com/article/10.1007/s00778-019-00588-3>. Acesso
em: 21 fev. 2021.

Raja, P.S.; Thangavel, K. 2020. Missing value imputation using unsupervised machine learning techniques. Soft
Computing, 24(6): 4361-4392. Disponível em: <https://link.springer.com/article/10.1007/s00500-019-04199-6>.
Acesso em: 21 fev. 2021.

Rubab, S.; Tang, J.; Wu, Y. 2021. Examining interaction techniques in data visualization authoring tools from
the perspective of goals and human cognition: a survey. Journal of Visualization, 24(1): 1-22. Disponível em:
<https://link.springer.com/article/10.1007/s12650-020-00705-3>. Acesso em: 21 fev. 2021.

21
R. B. dos Santos e F. Vasconcelos

Sefidian, A.M.; Daneshpour, N. 2020. Estimating missing data using novel correlation maximization based
methods. Applied Soft Computing, 91(1): 1-30. Disponível em: <https://www.sciencedirect.com/science/article/
abs/pii/S1568494620301897>. Acesso em: 21 fev. 2021.

Senapati, A.; Nag, A.; Mondal, A.; Maji, S. 2021. A novel framework for COVID-19 case prediction through
piecewise regression in India. International Journal of Information Technology, 13(1): 41-48. Disponível em:
<https://link.springer.com/article/10.1007/s41870-020-00552-3>. Acesso em: 21 fev. 2021.

Soares, N.; Aguiar, E.P.; Souza, A.C.; Goliatt, L. 2021. Unsupervised Machine Learning Techniques to
Prevent Faults in Railroad Switch Machines. International Journal of Critical Infrastructure Protection,
33(1): 1-14. Disponível em: <https://www.sciencedirect.com/science/article/abs/pii/S1874548221000159>.
Acesso em: 21 fev. 2021.

3.3. Clustering
“Clustering” é uma técnica de Machine Learning que envolve o agrupamento de observações.
As observações que estão no mesmo grupo devem ter propriedades e/ou qualidades semelhantes,
enquanto os dados em grupos diferentes devem ter propriedades e/ou recursos altamente diferentes.
O aluno pode aplicar um questionário para verificar se as empresas utilizam Automated Clustering para
analisar dados e auxiliar na tomada de decisão e como elas percebem que esta ferramenta agrega
valor na gestão dos negócios, especialmente na área de marketing e pesquisa do comportamento do
consumidor. Além disso, a realização de uma pesquisa similar à realizada por Byrnes (2019), na qual eles
utilizaram esta técnica para aumentar a probabilidade de detecção de irregularidades no processo de
auditoria, tendo em vista que o auditor não é treinado para lidar com altas complexidades e milhares de
dados, seria muito bem recepcionada. Também seria possível aplicar esta técnica na análise de dados
sobre seguro de carros, para verificar se essa técnica aumentou as chances de identificar se um cliente
tem potencial para se envolver em acidentes. Por fim, o aluno pode aplicar esta técnica para criação
de um modelo de classificação de risco de crédito, tendo como referência a pesquisa realizada por Dal
Magro et al. (2015), na qual eles aplicaram “clustering” para verificar como é o monitoramento, controle
e avaliação do risco de crédito de uma Cooperativa de Crédito com sede localizada no Oeste de Santa
Catarina. O pesquisador pode realizar esta pesquisa com utilização de base de dados abertas, como
por exemplo, os dados das empresas listadas na Bolsa de Valores do Brasil (B3). Também seria possível
aplicar a técnica de “clustering” para analisar o risco ambiental para determinado setor, visando prevenir
futuros acidentes.

Referências
Abad-Segura, E.; González-Zamar, M.D. 2020. Research analysis on emerging technologies in corporate
accounting. Mathematics, 8(9): 1-29. Disponível em: <https://www.mdpi.com/2227-7390/8/9/1589>. Acesso
em: 21 fev. 2021.

Byrnes, P.E. 2019. Automated clustering for data analytics. Journal of Emerging Technologies in Accounting,
16(2): 43-58. Disponível em: <https://meridian.allenpress.com/jeta/article-abstract/16/2/43/428479/
Automated-Clustering-for-Data-Analytics?redirectedFrom=fulltext>. Acesso em: 21 fev. 2021.

Crum, M.; Nelson, T.; Borst, J.; Byrnes, P. 2020. The use of cluster analysis in entrepreneurship research: Review
of past research and future directions. Journal of Small Business Management, 1(1): 1-40. Disponível em:
<https://www.tandfonline.com/doi/abs/10.1080/00472778.2020.1748475>. Acesso em: 21 fev. 2021.

Dal Magro, C.B.; Brighenti, J.; De Souza, T.R.; Lavarda, C.E.F.; Reiter, D.A. 2015. Gestão dos riscos financeiros na
área de crédito: um estudo em uma cooperativa de crédito localizada no oeste de Santa Catarina. Desenvolve
Revista de Gestão do Unilasalle, 4(1): 125-148. Disponível em: <https://svr-net15.unilasalle.edu.br/index.php/
desenvolve/article/view/2316-5537.2015.1>. Acesso em: 21 fev. 2021.

Fávero, L.P.; Belfiore, P. 2017. Manual de análise de dados. Elsevier, Rio de Janeiro, RJ, Brasil.

Fávero, L.P.; Belfiore, P. 2019. Data science for business and decision making. Academic Press, Cambridge, UK.

Prado, J.W.; Alcântara, V.C.; Carvalho, F.M.; Vieira, K.C.; Machado, L.K.; Tonelli, D.F. 2016. Multivariate analysis
of credit risk and bankruptcy research data: a bibliometric study involving different knowledge fields

22
TCC em Data Science e Analytics: áreas e linhas de pesquisa

(1968-2014). Scientometrics, 106(3): 1007-1029. Disponível em: <https://dl.acm.org/doi/abs/10.1007/s11192-


015-1829-6>. Acesso em: 21 fev. 2021.

Rosa, P.S.; Gartner, I.R. 2018. Financial distress em bancos brasileiros: um modelo de alerta antecipado. Revista
Contabilidade & Finanças, 29(77): 312-331. Disponível em: <https://www.scielo.br/scielo.php?pid=S1519-
70772017005009101&script=sci_arttext&tlng=pt>. Acesso em: 21 fev. 2021.

3.4. Análise Fatorial e PCA


A Análise Fatorial e a Análise dos Componentes Principais [PCA] fazem parte do conjunto de
ferramentas utilizadas em Data Science. Alguns estudos utilizaram a Análise Fatorial e a PCA para a
validação de construtos, variáveis latentes que não são possíveis de se observar diretamente, bem ainda
para reduzir em fatores as variáveis de um banco de dados. Assim, seria um tema para TCC utilizar estas
ferramentas para analisar quão exaustos os funcionários se sentem no contexto de trabalho no formato
home office e como isso tem afetado sua produtividade, tendo por base o estudo realizado por Andrade
et al. (2017), no qual utilizaram análise fatorial para analisar a influência dos valores relativos ao trabalho
e da satisfação no trabalho sobre os comportamentos de cidadania organizacional [CCO]. Além disso, é
possível utilizar as técnicas Análise Fatorial e PCA como método do TCC para verificar quais são os fatores
relevantes para a implementação de Data Science nas empresas. Há possibilidade de realizar um estudo
no TCC com utilização a análise fatorial numa escala de mensuração para identificar, por exemplo, com
as empresas percebem os benefícios do PIX ou do Open Banking para a gestão dos negócios, a partir da
análise dos fatores mais importantes. Por fim, por meio de questionário, é possível mapear se as empresas
utilizam análise fatorial no processo de tomada de decisão ou mesmo para de identificar quais são os
fatores mais relevantes em determinado processo ou contexto decisório. A partir desta técnica é possível
estudar quais as variáveis de um determinado fenômeno formam fatores para construir novos modelos.

Referências
Andrade, T.D.; Costa, V.F.; Estivalete, V.D.F.B.; Lengler, L. 2017. Comportamento de cidadania organizacional:
um olhar à luz dos valores e da satisfação no trabalho. Revista Brasileira de Gestão de Negócios, 19(64):
236-262. Disponível em: <https://www.scielo.br/scielo.php?pid=S1806-48922017000200236&script=sci_
arttext&tlng=pt>. Acesso em: 21 fev. 2021.

Fávero, L.P.; Belfiore, P. 2017. Manual de análise de dados. Elsevier, Rio de Janeiro, RJ, Brasil.

Fávero, L.P.; Belfiore, P. 2019. Data science for business and decision making. Academic Press, Cambridge, UK.

Ferreira, A.A.; Hongyu, K. 2018. Análise fatorial exploratória aplicada no questionário do cadastro
único. Biodiversidade, 17(1): 28-39. Disponível em: <https://periodicoscientificos.ufmt.br/ojs/index.php/
biodiversidade/article/view/6533>. Acesso em: 21 fev. 2021.

Lyra, W.D.S.; Silva, E.C.D.; Araújo, M.C.U.D.; Fragoso, W.D.; Veras, G. 2010. Classificação periódica: um exemplo
didático para ensinar análise de componentes principais. Química Nova, 33(7), 1594-1597. Disponível em:
<https://www.scielo.br/pdf/qn/v33n7/a30v33n7.pdf>. Acesso em: 21 fev. 2021.

Silva, B. G.; Moraes, T.E.N.T.; Costa, A.C.; Vieira, A.M.C. 2020. Percepção e satisfação no uso do aplicativo
edpuzzle utilizando análise fatorial exploratória. Research, Society and Development, 9(12), 1-16. Disponível
em: <https://www.rsdjournal.org/index.php/rsd/article/view/11065>. Acesso em: 21 fev. 2021.

Wartha, E.J.; Santana, D.A.S. 2020. Construção e validação de instrumento de coleta de dados na pesquisa em
Ensino de Ciências. Amazônia: Revista de Educação em Ciências e Matemáticas, 16(36): 39-52. Disponível em:
<https://periodicos.ufpa.br/index.php/revistaamazonia/article/view/7109>. Acesso em: 21 fev. 2021.

3.5. Análise de Correspondência Simples e Múltipla


A Análise de Correspondência é uma técnica adequada para analisar dados categóricos. Assim, ela
permite a análise das relações existentes entre observações por meio da redução de dimensionalidade
do conjunto de dados em análise. A Análise de Correspondência pode ser simples ou múltipla. No

23
R. B. dos Santos e F. Vasconcelos

TCC o discente pode aplicar a técnica de análise de correspondência para verificar, por exemplo, se
empresas que passaram pela transformação digital (variável categoria: sim ou não) aumentaram sua
produtividade. A análise desta relação entre as observações é feita por meio do mapa conceitual que
é um instrumento válido para tornar essa relação visual com a identificação das categorias. Diante das
possibilidades citadas, seria possível um TCC tendo como ponto de partida o estudo realizado por Santos
e Silva (2015), no qual eles utilizaram mapas conceituais para analisar a imagem de alguns dos mais
importantes destinos turísticos brasileiros na visão do consumidor paulistano com relação aos atrativos
naturais e culturais, oferta de entretenimento, serviços turísticos, segurança e hospitalidade. É cabível
utilizar no TCC mapas conceituais para verificar a relação entre duas variáveis, por exemplo, a associação
entre os gostos de consumo e o grau de escolaridade de determinado consumidor. Além disso, a partir
da aplicação de um questionário ou realização de entrevistas é possível construir um TCC que tenha
como objetivo de pesquisa verificar se as empresas utilizam mapas perceptuais para tomada de decisão
ou mesmo criar metodologias baseadas no uso desta técnica para classificar os consumidores a partir
das suas preferências.

Referências
Beldona, S.,; Morrison, A.M.; O’Leary, J. 2005. Online shopping motivations and pleasure travel products: a
correspondence analysis. Tourism Management, 26(4), 561-570. Disponível em: <https://www.sciencedirect.
com/science/article/pii/S0261517704000731>. Acesso em: 21 fev. 2021.

Bortoli, L.V.; Birck, A. 2017. Mapa perceptual no contexto empresarial: aspectos relevantes para a sua
elaboração. Revista de Administração, IMED 7(1): 230-249. Disponível em: <https://seer.imed.edu.br/index.
php/raimed/article/view/1626/1255>. Acesso em: 21 fev. 2021.

Cardoso, M.M.J.; Scarpel, R.A. 2013. Métodos de construção e interpretação do mapa perceptual para estudos
de percepção de riscos. Pesquisa Operacional para o Desenvolvimento, 5(3): 443-475. Disponível em: < https://
podesenvolvimento.org.br/podesenvolvimento/article/view/244>. Acesso em: 21 fev. 2021.

Fávero, L.P.; Belfiore, P. 2017. Manual de análise de dados. Elsevier, Rio de Janeiro, RJ, Brasil.

Fávero, L.P.; Belfiore, P. 2019. Data science for business and decision making. Academic Press, Cambridge, UK.

Infantosi, A.F.C.; Costa, J.C.D.G.D.; Almeida, R.M.V.R.D. 2014. Análise de Correspondência: bases teóricas
na interpretação de dados categóricos em Ciências da Saúde. Cadernos de Saúde Pública, 30(1): 473-486.
Disponível em: <https://www.scielo.br/pdf/csp/v30n3/0102-311X-csp-30-3-0473.pdf>. Acesso em: 21 fev. 2021.

Kamalja, K.K.; Khangar, N.V. 2017. Multiple correspondence analysis and its applications. Electronic Journal
of Applied Statistical Analysis, 10(2): 432-462. Disponível em: < http://siba-ese.unisalento.it/index.php/ejasa/
article/view/16823>. Acesso em: 21 fev. 2021.

Santos, G.E.O.; Silva, V.J. 2015. Mapa perceptual como ferramenta para a análise da imagem de destinos
turísticos. Revista de Turismo Contemporâneo, 3(2): 211-231. Disponível em: <https://periodicos.ufrn.br/
turismocontemporaneo/article/view/6856>. Acesso em: 21 fev. 2021.

3.6. Supervised Machine Learning Techniques


As técnicas de Machine Learning Supervisionadas (Supervised Machine Learning Techniques) é
uma subcategoria de Machine Learning. Elas são definidas pelo uso de conjuntos de dados para treinar
algoritmos que predizem resultados com eficiência. As técnicas de Machine Learning supervisionadas
podem ser utilizadas com o objetivo de predição. Assim, um TCC poderia aplicar esta técnica para prever
a demanda dos produtos de determinada empresa ao realizar um estudo de caso. Além disso, seria
possível através da aplicação de questionário averiguar em quais contextos as empresas utilizam as
técnicas de Supervised Machine Learning Techniques na gestão dos seus negócios e se elas percebem
que essas técnicas são precisas e confiáveis. O aluno também poderia aplicar as Supervised Machine
Learning Techniques em uma base de dados aberta para analisar comparativamente o desempenho
de determinada técnica, tendo como parâmetro o estudo realizado por Mathivanan et al. (2019), no

24
TCC em Data Science e Analytics: áreas e linhas de pesquisa

qual avaliaram o desempenho de cinco diferentes modelos de Machine Learning Supervisionados em


conjuntos de dados compostos por títulos de produtos de comércio eletrônico com uma descrição muito
curta e incompletas. Por fim, as técnicas de Machine Learning Supervisionadas podem ser utilizadas
para classificação automática de textos. Assim, por meio de um levantamento de dados, por meio de um
questionário, seria possível verificar quais as principais técnicas de Machine Learning Supervisionadas
utilizadas para a classificação automática de textos que as empresas utilizam na gestão dos seus
negócios. O aluno pode ter como referência a pesquisa realizada por Kadhim (2019) neste sentido.

Referências
Christensen, R. 1997. Log-linear models and logistic regression. 2ed. Springer-Verlag, New York, NY, USA.

Dhar, A.; Mukherjee, H.; Dash, N.S.; Roy, K. 2020. Text categorization: past and present. Artificial Intelligence
Review, 54(1): 3007–3054. Disponível em: <https://link.springer.com/article/10.1007/s10462-020-09919-1>.
Acesso em: 21 fev. 2021.

Fávero, L.P.; Belfiore, P. 2017. Manual de análise de dados. Elsevier, Rio de Janeiro, RJ, Brasil.

Fávero, L.P.; Belfiore, P. 2019. Data science for business and decision making. Academic Press, Cambridge, UK.

Garson, G.D. 2012. Logistic regression: binary & multinomial. Statistical Associates Publishing,
Asheboro, NC, USA.

Gujarati, D.N. 2011. Econometria básica. 5ed. Bookman, Porto Alegre, MG, Brasil.

Hanck, C.; Arnold, M.; Gerber, A.; Schmelzer, M. 2020. Introduction to econometrics with R. Department of
Business Administration and Economics, University of Duisburg-Essen, Essen, Germany. Disponível em: https://
www.econometrics-with-r.org/. Acesso em: 15 ago. 2021.

Hilbe, J.M. 2009. Logistic regression models. Chapman & Hall / CRC Press, London, UK.

Hosmer, D.W.; Lemeshow, S.; Sturdivant, R.X. 2013. Applied logistic regression. 3ed. John Wiley & Sons, New
York, NY, USA.

Hosmer, D.W.; Taber, S.; Lemeshow, S. 1991. The importance of assessing the fit of logistic regression models:
a case study. American Journal of Public Health, 81: 1630-1635.

Kadhim, A.I. 2019. Survey on supervised machine learning techniques for automatic text classification. Artificial
Intelligence Review, 52(1): 273-292. Disponível em: <https://link.springer.com/article/10.1007/s10462-018-
09677-1> Acesso em: 21 fev. 2021.

Kleinbaum, D.G.; Klein, M. 2010. Logistic regression: a self-learning text. 3ed. Springer, New York, NY, USA.

Kutner, M.H.; Nachtshein, C.J.; Neter, J. 2004. Applied linear regression models. 4ed. Irwin, Chicago, USA.

Mathivanan, N.M.N.; MdGhani, N.A.; Janor, R.M. 2019. Performance analysis of supervised learning
models for product title classification. IAES International Journal of Artificial Intelligence, 8(3): 228-236.
Disponível em: <https://search.proquest.com/openview/6873420c01fed934900d1a4ac989a6e4/1?pq-
origsite=gscholar&cbl=1686339>. Acesso em: 21 fev. 2021.

McNulty, K. 2022. Handbook of regression modeling in people analytics: with examples in R and Python. CRC
Press, New York, NY, USA.

Oliveira, N.R.; Pisa, P.S.; Lopez, M.A.; Medeiros, D.S.V.; Mattos, D.M. 2021. Identifying Fake News on Social
Networks Based on Natural Language Processing: Trends and Challenges. Information, 12(1): 1-32. Disponível
em: <https://www.mdpi.com/2078-2489/12/1/38>. Acesso em: 21 fev. 2021.

Oswald, F.; Viers, V.; Robin, J.-M.; Villedieu, P.; Kenedi, G. 2020. Introduction to econometrics with R. Syllabus.
Disponível em: https://scpoecon.github.io/ScPoEconometrics/. Acesso em: 14 ago. 2021.

Shmueli, G.; Bruce, P.C.; Yahav, I.; Patel, N.R.; Lichtendanl, K.C. 2018. Data mining for business analytics:
concepts, techniques, and applications in R. John Wiley & Sons, New York, NY, USA.

25
R. B. dos Santos e F. Vasconcelos

Verma, C.; Stoffová, V.; Illés, Z. 2019. Prediction of students’ awareness level towards ICT and mobile technology
in Indian and Hungarian University for the real-time: preliminary results. Heliyon, 5(6): 1-9. Disponível em:
<https://www.sciencedirect.com/science/article/pii/S2405844018390972>. Acesso em: 21 fev. 2021.

Vitkus, D.; Jezukevičiūtė, J.; Goranin, N. 2020. Dynamic Expert System-Based Geographically Adapted Malware
Risk Evaluation Method. International journal of computers communications & control, 15(3): 1-9. Disponível
em: <http://univagora.ro/jour/index.php/ijccc/article/view/3865>. Acesso em: 21 fev. 2021.

Wooldridge, J.M. 2012. Introductory econometrics: a modern approach. 5ed. Cengage Learning,
Mason, OH, USA.

3.7. Análise de Regressão Simples e Múltipla


A análise de regressão pode ser tanto simples quanto múltipla. Esta é uma ferramenta em Data
Science útil para análise de dados e tomada de decisão. A análise de regressão pode ser utilizada em
diversos contextos, tal como na gestão de custos. Assim, seria viável realizar um estudo de caso no TCC
e aplicar a técnica regressão, com o objetivo de verificar como os custos desta empresa podem ser mais
bem geridos. Além disso, a técnica de regressão pode ser utilizada também para prever a demanda de
um produto da empresa, tendo como modelo o estudo de Bouzada e Saliby (2009), no qual utilizaram
a regressão linear múltipla para prever a demanda de ligações em um “call center”. Eles realizaram um
estudo de um caso de forma a resolver esse problema de grande empresa brasileira do setor, a Contax.
Assim, o aluno pode aplicar esta técnica para resolver problemas de demanda ou produção de um
produto. A técnica de regressão também pode ser útil para resolver problemas com despesas. Telles et
al. (2019) analisaram as oscilações nas despesas contínuas e suas múltiplas causalidades com o objetivo
de entender o comportamento delas em determinada conjuntura. O aluno também pode realizar esta
mesma pesquisa ao fazer um estudo de caso no qual a empresa tem o problema de entender o que está
causando determinadas despesas.

Referências
Bouzada, M.A.C.; Saliby, E. 2009. Prevendo a demanda de ligações em um call center por meio de um modelo
de Regressão Múltipla. Gestão & Produção, 16(3), 382-397. Disponível em: <https://www.scielo.br/pdf/gp/
v16n3/v16n3a06.pdf>. Acesso em: 21 fev. 2021.

Canhanga, P.E. 2020. Modelo matemático para previsão de vendas: Regressão Linear Simples. Cadernos do
IME-Série Matemática, 14(1): 71-81. Disponível em: <https://www.e-publicacoes.uerj.br/index.php/cadmat/
article/view/50427>. Acesso em: 21 fev. 2021.

Fávero, L.P.; Belfiore, P. 2017. Manual de análise de dados. Elsevier, Rio de Janeiro, RJ, Brasil.

Fávero, L.P.; Belfiore, P. 2019. Data science for business and decision making. Academic Press, Cambridge, UK.

Gujarati, D.N. 2011. Econometria básica. 5ed. Bookman, MG, Brasil.

Hanck, C.; Arnold, M.; Gerber, A.; Schmelzer, M. 2020. Introduction to econometrics with R. Department of
Business Administration and Economics, University of Duisburg-Essen, Essen, Germany. Disponível em:
<https://www.econometrics-with-r.org/>.

Heintze, T.C.D.S.; Terroso, W.A.P.L.N.; Costa, I.L.; Vincenzi, S.L.; Mendonça, S.N.T.G. 2017. A aplicação
da regressão linear na análise de custos de uma empresa hidropônica. Revista Produção Industrial e
Serviços, 4(2): 91-102. Disponível em: <http://www.dep.uem.br/gdct/index.php/rev_prod2/article/view/1505>.
Acesso em: 21 fev. 2021.

Kutner, M.H.; Nachtshein, C.J.; Neter, J. 2004. Applied linear regression models. 4ed. Chicago: Irwin.

Ma, S.; Fildes, R.; Huang, T. 2016. Demand forecasting with high dimensional data: The case of SKU retail
sales forecasting with intra- and inter-category promotional information. European Journal of Operational
Research, 249(1): 245–257. Disponível em: < https://www.sciencedirect.com/science/article/abs/pii/
S0377221715007845>. Acesso em: 21 fev. 2021.

26
TCC em Data Science e Analytics: áreas e linhas de pesquisa

McNulty, K. Handbook of regression modeling in people analytics: with examples in R and Python. New York:
CRC Press, 2022.

Oswald, F.; Viers, V.; Robin, J.-M.; Villedieu, P.; Kenedi, G. 2020. Introduction to econometrics with R. Syllabus.
Disponível em: <https://scpoecon.github.io/ScPoEconometrics/>.

Telles, C.R.; Cunha, A.R.B.; Chueiri, A.M.S.; Kuromiya, K. 2019. Analysis of oscillations in continuous expenditures
and their multiple causalities: A case study. Journal of Economic and Administrative Sciences, 35(1): 44-64.
Disponível em: <https://www.emerald.com/insight/content/doi/10.1108/JEAS-06-2018-0073/full/html>. Acesso
em: 21 fev. 2021.

Walter, O.M.F.C.; Henning, E.; Moro, G.; Samohyl, R.W. 2013. Aplicação de um modelo SARIMA na previsão de
vendas de motocicletas. Exacta, 11(1): 77-88. Disponível em: <https://periodicos.uninove.br/exacta/article/
viewFile/3897/2482>. Acesso em: 21 fev. 2021.

Wooldridge, J.M. 2012. Introductory econometrics: a modern approach. 5ed. Mason: Cengage Learning.

3.8. Modelos Logísticos Binários e Multinomiais


Os modelos logísticos binários e multinomiais são utilizados quando as variáveis são binárias, ou
seja, não são variáveis contínuas. Esses modelos podem ser aplicados para análise de risco, cobrança,
entre outros contextos. Assim, o aluno pode, em seu TCC, propor um modelo logístico para prever o risco
operacional de ocorrência de determinado acidente de uma empresa automobilística, por exemplo.
Também é viável aplicar modelos logísticos para resolver problemas de cobranças ao propor um
modelo de “Credit Scoring”. Desta forma, o TCC teria como referência o estudo realizado por Araújo et
al. (2007), no qual avaliaram a possibilidade de aplicação de modelos “Credit Scoring” em uma instituição
de microcrédito denominada Fundo Rotativo de Ação da Cidadania – Cred Cidadania, situada em Recife
(PE), por meio da utilização de modelos binários, bem como a pesquisa realizada por Gonçalves et al.
(2013), que aplicou a técnica de regressão logística no desenvolvimento de um modelo de predição
de inadimplência com dados de uma instituição financeira. Em seu TCC, o aluno pode aplicar essa técnica
para prever a inadimplência nas faculdades privadas no contexto da pandemia COVID-19.

Referências
Albuquerque, P.H.M.; Medina, F.A.S.; Silva, A.R.D. 2017. Regressão Logística Geograficamente Ponderada
Aplicada a Modelos de Credit Scoring. Revista Contabilidade & Finanças, 28(73): 93-112. Disponível em:
<https://www.scielo.br/scielo.php?pid=S1519-70772017000100093&script=sci_arttext&tlng=pt>. Acesso em:
21 fev. 2021.

Araújo, E.A.; Carmona, C.U.M. 2007. Desenvolvimento de modelos Credit Scoring com abordagem de
regressão logística para a gestão da inadimplência de uma instituição de microcrédito. Contabilidade Vista &
Revista, 18(3): 107-131. Disponível em: <https://www.redalyc.org/pdf/1970/197014735006.pdf>. Acesso em: 21
fev. 2021.

Christensen, R. 1997. Log-linear models and logistic regression. 2ed. Springer-Verlag. New York, NY, USA.

Costa, W.B.D.; Macedo, M.A.D.S.; Yokoyama, K.Y; Almeida, J.E.F.D. 2017. Análise dos Estágios de ciclo
de vida de companhias abertas no Brasil: um estudo com base em variáveis contábil-financeiras. BBR.
Brazilian Business Review, 14(3): 304-320. Disponível em: <https://www.scielo.br/scielo.php?pid=S1808-
23862017000300304&script=sci_arttext&tlng=pt>. Acesso em: 21 fev. 2021.

Fávero, L.P.; Belfiore, P. 2017. Manual de análise de dados. Elsevier, Rio de Janeiro, RJ, Brasil.

Fávero, L.P.; Belfiore, P. 2019. Data science for business and decision making. Academic Press, Cambridge, UK.

Garson, G.D. 2012. Logistic regression: binary & multinomial. Statistical Associates Publishing, Asheboro, USA.

Gonçalves, E.B.; Gouvêa, M.A.; Mantovani, D.M.N. 2013. Análise de risco de crédito com o uso de regressão
logística. Revista Contemporânea de Contabilidade, 10(20): 139-160. Disponível em: <https://periodicos.ufsc.br/
index.php/contabilidade/article/view/2175-8069.2013v10n20p139>. Acesso em: 21 fev. 2021.

27
R. B. dos Santos e F. Vasconcelos

Gujarati, D.N. 2011. Econometria básica. 5ed. Bookman, Porto Alegre, RS, Brasil.

Hilbe, J.M.2009. Logistic regression models. Chapman & Hall / CRC Press, London, UK.

Hosmer, D.W.; Lemeshow, S.; Sturdivant, R.X. 2013. Applied logistic regression. 3ed. John Wiley & Sons, NY, USA.

Hosmer, D.W.; Taber, S.; Lemeshow, S. 1991. The importance of assessing the fit of logistic regression models:
a case study. American Journal of Public Health, 81: 1630-1635.

Itoo, F.; Singh, S. 2020. Comparison and analysis of logistic regression, Naïve Bayes and KNN machine learning
algorithms for credit card fraud detection. International Journal of Information Technology, 1(1): 1-9. Disponível
em: <https://link.springer.com/article/10.1007%2Fs41870-020-00430-y>. Acesso em: 21 fev. 2021.

Kleinbaum, D.G.; Klein, M. 2010. Logistic regression: a self-learning text. 3ed. Springer, New York, NY, USA.

Shmueli, G.; Bruce, P.C.; Yahav, I.; Patel, N.R.; Lichtendanl, K.C. 2018. Data mining for business analytics:
concepts, techniques, and applications in R. John Wiley & Sons, New York, NY, USA.

Souza, P.A.R.; Romeiro, M.C. 2017. As instituições de microcrédito no Brasil: uma perspectiva sobre o fluxo
de fundos no setor. Revista Contemporânea de Contabilidade, 14(33): 88-100. Disponível em: <https://www.
redalyc.org/pdf/762/76257049005.pdf>. Acesso em: 21 fev. 2021.

3.9. Modelos para Dados de Contagem e Zero-Inflated Models


Em alguns casos, a base de dados em análise terá muitos zeros. Para tratar esse problema, uma das
soluções é utilizar modelos para Dados de Contagem e “Zero-Inflated Models”. Os modelos para dados
de contagem com excesso de zeros podem ser aplicados em alguns contextos. O aluno pode, em seu
TCC, aplicar essa técnica para calcular a probabilidade de inadimplência, por exemplo, de uma empresa,
usando como referência o estudo realizado por Akiama (2008), no qual utilizou Modelos para Dados de
Contagem e “Zero-Inflated Models” para calcular a probabilidade de inadimplência de grandes empresas
no sistema financeiro nacional. Quando os dados são longitudinais, é necessário utilizar uma modelagem
para Dados Longitudinais de Contagem. Desta forma, há possibilidade de aplicar esta técnica no TCC
para calcular a probabilidade de uma empresa automobilística realizar “recall” de carros, tendo por base
a pesquisa realizada por Silva (2012), na qual propôs um modelo de Poisson zero inflacionado aplicado
ao número de defeitos em veículos.

Referências
Ancelet, S.; Etienne, M.P.; Benoît, H.; Parent, E. 2010. Modelling spatial zero-inflated continuous data with an
exponentially compound Poisson process. Environmental and Ecological Statistics, 17(3): 347-376. Disponível
em: < https://link.springer.com/content/pdf/10.1007/s10651-009-0111-6.pdf>. Acesso em: 25 mar. 2021.

Akiama, S.R. 2008. Probabilidade de inadimplência de grandes empresas no sistema financeiro


nacional (Doctoral dissertation, Universidade de São Paulo). Disponível em: <https://www.teses.usp.br/teses/
disponiveis/12/12136/tde-04062008-120550/en.php>. Acesso em: 21 fev. 2021.

Araujo, A.P.S.R.; Rodrigues, W.; Silva, W.S.; Sousa, P.A.B. 2018. Biotecnologia e Desenvolvimento Regional:
O Caso da Indústria de medicamentos de uso humano e fitoterápicos no Brasil e na região da Amazônia
Legal. Revista Brasileira de Gestão e Desenvolvimento Regional, 14(2): 428-454. Disponível em: <https://www.
rbgdr.com.br/revista/index.php/rbgdr/article/view/3600>. Acesso em: 21 fev. 2021.

Fávero, L.P.; Belfiore, P. 2017. Manual de análise de dados. Elsevier, Rio de Janeiro, RJ, Brasil.

Fávero, L.P.; Belfiore, P. 2019. Data science for business and decision making. Academic Press, Cambridge, UK.

Liu, L.; Shih, Y.C.T.; Strawderman, R.L.; Zhang, D.; Johnson, B.A.; Chai, H. 2019. Statistical analysis of zero-inflated
nonnegative continuous data: a review. Statistical Science, 34(2): 253-279. Disponível em: <https://projecteuclid.
org/journals/statistical-science/volume-34/issue-2/Statistical-Analysis-of-Zero-Inflated-Nonnegative-
Continuous-Data--A/10.1214/18-STS681.short>. Acesso em: 25 mar. 2021.

Oswald, F.; Viers, V.; Robin, J.-M.; Villedieu, P.; Kenedi, G. 2020. Introduction to econometrics with R. Syllabus.
Disponível em: <https://scpoecon.github.io/ScPoEconometrics/>.

28
TCC em Data Science e Analytics: áreas e linhas de pesquisa

Raihan, M.A.; Alluri, P.; Wu, W., Gan, A. 2019. Estimation of bicycle crash modification factors (CMFs) on urban
facilities using zero inflated negative binomial models. Accident Analysis & Prevention, 123(1): 303-313.
Disponível em: < https://www.sciencedirect.com/science/article/pii/S0001457518311254?casa_token=UpGQ
6tBzXQwAAAAA:Tfbeg0s7fJ-lAYlDOGi-PZwQ_7izC-AgBDDcBED98KDJpIz79RZznMrk_W3qcak6uNtLNL7qVw >.
Acesso em: 25 mar. 2021.

Silva, D.D. 2012. Modelo poisson zero inflacionado aplicado ao número de defeitos em veículos. Revista
Eletrônica eF@ tec, 2(1): 9-9. Disponível em: <https://fatecgarca.edu.br/ojs/index.php/efatec/article/view/18>.
Acesso em: 21 fev. 2021.

3.10. Modelagem Hierárquica e Multinível


Existem alguns casos em que a estrutura de dados pode ser analisada pelos modelos multiníveis
ou hierárquicos. Ou seja, neste tipo de estrutura, as unidades são agrupadas em diferentes níveis
hierárquicos. A modelagem hierárquica e multinível pode ser aplicada para resolver problemas sobre
desempenho dos funcionários. Assim, o estudante pode propor em seu TCC um modelo de modelagem
Hierárquica e Multinível para verificar quais são os fatores que afetam o desempenho dos colaboradores
de determinada empresa, tendo como referência o estudo realizado por Coelho e Andrade (2011), em
que foi utilizada essa modelagem para discutir as contribuições potenciais da modelagem multinível na
investigação de desempenho no trabalho. Além disso, seria possível no TCC utilizar esta técnica para
compreender quais os fatores que afetam o setor imobiliário de um determinado estado ou cidade,
usando como base a pesquisa realizada por Fávero (2011), que foi utilizada essa modelagem com o
objetivo de examinar a influência das características dos imóveis, dos distritos e das zonas comerciais
sobre os preços de aluguel em São Paulo. Há também a possibilidade de aplicar essa técnica para
analisar a valorização de imóveis em uma determinada região, servido de base teórica o estudo realizado
por Rocha e Magalhães (2013), o qual aplicou essa técnica para mensurar a valoração das amenidades
urbanas ao fazer uma estimação a partir dos diferenciais salariais e do custo de habitação para as regiões
metropolitanas brasileiras.

Referências
Bickel, R. 2007. Multilevel analysis for applied research: it’s just regression! The Guilford Press, New York, NY, USA.

Campos, R.B.A.; Almeida, E.S.D. 2018. Decomposição espacial nos preços de imóveis residenciais no município
de São Paulo. Estudos Econômicos (São Paulo), 48(1): 5-38. Disponível em: <https://www.scielo.br/scielo.
php?pid=S0101-41612018000100005&script=sci_arttext&tlng=pt>. Acesso em: 21 fev. 2021.

Coelho, F.A.; Borges-Andrade, J.E. 2011. Discussão sobre algumas contribuições da modelagem multinível para
a investigação de desempenho no trabalho. Psico-USF, 16(2): 135-142. Disponível em: <https://www.scielo.br/
scielo.php?pid=S1413-82712011000200002&script=sci_arttext&tlng=pt>. Acesso em: 21 fev. 2021.

Courgeau, D. 2003. Methodology and epistemology of multilevel analysis. Kluwer Academic Publishers.
London, UK.

Fávero, L.P.; Belfiore, P. 2017. Manual de análise de dados. Elsevier, Rio de Janeiro, RJ, Brasil.

Fávero, L.P.; Belfiore, P. 2019. Data science for business and decision making. Academic Press, Cambridge, UK.

Fávero, L.P.L. 2011. Preços hedônicos no mercado imobiliário comercial de São Paulo: a abordagem
da modelagem multinível com classificação cruzada. Estudos Econômicos (São Paulo), 41(4): 777-810.
Disponível em: <https://www.scielo.br/scielo.php?pid=S0101-41612011000400005&script=sci_arttext>.
Acesso em: 21 fev. 2021.

Goldstein, H. 2011. Multilevel statistical models. 4ed. John Wiley & Sons.Chichester, UK.

Hair, J.F.; Fávero, L.P. 2019. Multilevel modeling for longitudinal data: concepts and applications. RAUSP
Management Journal, 54(4): 459-489. Disponível em: <https://www.emerald.com/insight/content/doi/10.1108/
RAUSP-04-2019-0059/full/html>. Acesso em: 21 fev. 2021.

Putra, I.G.N.E.; Astell-Burt, T.; Cliff, D.P.; Vella, S.A.; Feng, X. 2020. Association between green space quality and
prosocial behaviour: A 10-year multilevel longitudinal analysis of Australian children. Environmental Research

29
R. B. dos Santos e F. Vasconcelos

1-11. Disponível em: <https://www.sciencedirect.com/science/article/abs/pii/S0013935120312317>. Acesso


em: 21 fev. 2021.

Rabe-Hesketh, S.; Skrondal, A. 2012. Multilevel and longitudinal modeling: continuous responses (Vol. I). 3ed.
Stata Press. College Station, USA.

Raudenbush, S.W.; Bryk, A.S. 2002. Hierarchical linear models: applications and data analysis methods. 2ed. :
Sage Publications. Thousand Oaks, CA, USA.

Rocha, R.D.M.; Magalhães, A. 2013. Valoração das amenidades urbanas: uma estimação a partir dos
diferenciais salariais e do custo de habitação para as regiões metropolitanas brasileiras. Revista de
Economia contemporânea, 17(1): 69-98. Disponível em: <https://www.scielo.br/scielo.php?pid=S1415-
98482013000100003&script=sci_arttext>. Acesso em: 21 fev. 2021.

Steele, F. 2017. Multilevel models for longitudinal data. Centre of Multilevel Modelling, University of Bristol.
Disponível em: <https://www.bristol.ac.uk/media-library/sites/cmm/migrated/documents/longitudinal.pdf>.
Acesso em: 01 ago. 2021

West, B.T.; Welch, K.B.; Gałecki, A.T. 2015. Linear mixed models: a pratical guide using statistical software. 2ed.
Chapman & Hall / CRC Press. Boca Raton, USA..

3.11. Árvores de Decisão e CARTs


Outra ferramenta útil para análise de dados são as árvores de decisão e CARTs. As árvores
de decisão consistem em uma hierarquia de nós internos e externos que são conectados por
ramos. As técnicas de árvore de decisão têm sido amplamente utilizadas para construir modelos
de classificação e ajudam no processo de decisão. Assim, seria viável realizar um levantamento por
meio de questionário para verificar se as empresas utilizam as ferramentas de Árvores de Decisão
e CARTs na gestão dos seus negócios. Além disso, também haveria a possibilidade de propor um
modelo no TCC de árvore de decisão que possa auxiliar as empresas a lidar com a incerteza em
seus negócios, especialmente, no contexto pós-pandemia ou crise, como na pesquisa realizada por
Ma et al. (2016), em que propuseram um método de aprendizagem de árvore de decisão que pode
não apenas lidar com dados incertos, mas também reduzir a incerteza. Outra aplicação da árvore
de decisão é com relação à previsão de demanda, em que é possível aplicar a referida técnica para
prever o volume de suprimentos para uma empresa, por exemplo, do setor agrícola. Um estudo que
poderia servir de base foi realizado por Johnansson et al. (2019), que previu a demanda operacional
em sistemas de aquecimento urbano, usando conjuntos de algoritmos de machine learning e árvore
de decisão. Por fim, o aluno tem a possibilidade de combinar essas duas técnicas em seu TCC para
prever como será a produtividade do Brasil nos próximos anos.

Referências
Brodley, C.E.; Utgoff, P.E. 1995. Multivariate decision trees. Machine learning, 19(1): 45-77. Disponível em:
<https://link.springer.com/article/10.1007/BF00994660>. Acesso em: 21 fev. 2021.

Johansson, C.; Bergkvist, M.; Geysen, D.; Somer, O.; Lavesson, N.; Vanhoudt, D. 2017. Operational demand
forecasting in district heating systems using ensembles of online machine learning algorithms. Energy
Procedia, 116(1): 208-216. Disponível em: <https://www.sciencedirect.com/science/article/pii/
S1876610217322750>. Acesso em: 21 fev. 2021.

Kotsiantis, S.B. 2013. Decision trees: a recent overview. Artificial Intelligence Review, 39(4): 261-283. Disponível
em: <https://link.springer.com/article/10.1007/s10462-011-9272-4>. Acesso em: 21 fev. 2021.

Ma, L.; Destercke, S.; Wang, Y. 2016. Online active learning of decision trees with evidential data. Pattern
Recognition, 52(1): 33-45. Disponível em: <https://www.sciencedirect.com/science/article/abs/pii/
S0031320315003933>. Acesso em: 21 fev. 2021.

Shmueli, G.; Bruce, P.C.; Yahav, I.; Patel, N.R.; Lichtendanl, K.C. 2018. Data mining for business analytics:
concepts, techniques, and applications in R. John Wiley & Sons, New York, NY, USA.

30
TCC em Data Science e Analytics: áreas e linhas de pesquisa

Tanizaki, T.; Hoshino, T.; Shimmura, T.; Takenaka, T. 2019. Demand forecasting in restaurants using machine
learning and statistical analysis. Procedia CIRP, 79(1): 679-683. Disponível em: <https://www.sciencedirect.com/
science/article/pii/S2212827119301568>. Acesso em: 21 fev. 2021.

Weinberg, A.I.; Last, M. 2019. Selecting a representative decision tree from an ensemble of decision-tree
models for fast big data classification. Journal of Big Data, 6(1): 1-17. Disponível em: <https://link.springer.com/
article/10.1186/s40537-019-0186-3>. Acesso em: 21 fev. 2021.

3.12. Ensemble Models


Em Data Science e Analytics, os Ensemble Models são métodos de agrupamento que usam vários
algoritmos para obter melhor desempenho preditivo do que o obtido por qualquer um dos demais
algoritmos. Os Ensemble Models podem ser aplicados para construir um TCC mediante sua aplicação em
um “dataset” com dados faltantes e verificar o impacto destes modelos nos resultados obtidos, recorrendo
ao estudo de referência por Sovilij et al. (2016), quando foi aplicado ensemble modelos numa base de
dados ausentes e verificaram que houve melhoria na estimação dos resultados. Similarmente, pode-se
aplicar estes modelos e verificar se realmente eles ajudam a melhorar a estimação dos resultados. Além
disso, é viável aplicar os ensemble models para fazer previsão, como por exemplo, verificar a tendência
de aumento ou diminuição no número de novos investidores na bolsa de valores no Brasil. Gupta e
Rani (2020) com o objetivo de aprimorar a detecção de “malware”, utilizaram ensemble models, razão
pela qual o aluno pode aplicar esses modelos em dados do Brasil para verificar se eles são capazes de
detectar a referida ameaça. Kalantar et al. (2020), por sua vez, aplicaram ensemble models para mapear
a suscetibilidade a deslizamentos. Em seu TCC é cabível se servir desses modelos para mapear ou prever
o acontecimento de determinados eventos que aumentam o risco da empresa.

Referências
Galicia, A.; Talavera-Llames, R.; Troncoso, A.; Koprinska, I.; Martínez-Álvarez, F. 2019. Multi-step forecasting for
big data time series based on ensemble learning. Knowledge-Based Systems, 163(1): 830-841. Disponível em:
<https://www.sciencedirect.com/science/article/abs/pii/S0950705118304957>. Acesso em: 21 fev. 2021.

Gupta, D.; Rani, R. 2020. Improving malware detection using big data and ensemble learning. Computers &
Electrical Engineering, 86(1): 1-17. Disponível em: <https://www.sciencedirect.com/science/article/abs/pii/
S004579062030584X>. Acesso em: 21 fev. 2021.

Huang, G.B.; Wang, D.H.; Lan, Y. 2011. Extreme learning machines: a survey. International journal of machine
learning and cybernetics, 2(2): 107-122. Disponível em: <https://link.springer.com/article/10.1007%2Fs13042-
011-0019-y>. Acesso em: 21 fev. 2021.

Kalantar, B.; Ueda, N.; Saeidi, V.; Ahmadi, K.; Halin, A.A.; Shabani, F. 2020. Landslide susceptibility mapping:
Machine and ensemble learning based on remote sensing big data. Remote Sensing, 12(11): 1-23. Disponível
em: <https://www.mdpi.com/2072-4292/12/11/1737>. Acesso em: 21 fev. 2021.

Shmueli, G.; Bruce, P.C.; Yahav, I.; Patel, N.R.; Lichtendanl, K.C. 2018. Data mining for business analytics:
concepts, techniques, and applications in R. John Wiley & Sons, New York, NY, USA.

Sovilj, D.; Eirola, E.; Miche, Y.; Björk, K.M.; Nian, R.; Akusok, A.; Lendasse, A. 2016. Extreme learning machine
for missing data using multiple imputations. Neurocomputing, 174(1): 220-231. Disponível em: <https://www.
sciencedirect.com/science/article/abs/pii/S0925231215011182>. Acesso em: 21 fev. 2021.

Van Heeswijk, M.; Miche, Y.; Lindh-Knuutila, T.; Hilbers, P.A.; Honkela, T.; Oja, E.; Lendasse, A. 2009. Adaptive
ensemble models of extreme learning machines for time series prediction. In International Conference
on Artificial Neural Networks. Springer, Berlin, Heidelberg. Disponível em: <https://link.springer.com/
chapter/10.1007/978-3-642-04277-5_31>. Acesso em: 21 fev. 2021.

3.13. Random Forest


As Random Forests são um método de machine learning em que para analisar os dados são
construídas inúmeras árvores de decisão. Esse método pode ser aplicado em diversos contextos. Por
exemplo, o aluno pode aplicar essa técnica para selecionar variáveis que devem compor o modelo

31
R. B. dos Santos e F. Vasconcelos

estatístico que analisa a relação entre a produtividade e o nível de informatização das empresas,
servido de referencial teórico o estudo realizado por Genuer et al. (2010), no qual propõem um
método estatístico para investigar a seleção de variáveis por meio desta técnica. É cabível realizar
algumas simulações ao aplicar esse método em dados do Brasil para verificar como ele seleciona as
variáveis para seu modelo estatístico. Por outro lado, Biau (2012) fornece uma análise aprofundada
de um modelo de Random Forest. Especificamente, ele mostra que o procedimento é consistente e se
adapta à dispersão, no sentido de que sua taxa de convergência depende apenas do número de fortes
recursos e não em quantas variáveis de
​​ ruído estão presentes. É viável testar no TCC esse resultado
encontrado por Biau (2012) e verificar se para os dados do Brasil, o modelo de Random Forest é
consistente e se adapta à dispersão.

Referências
Biau, G. 2012. Analysis of a random forests model. The Journal of Machine Learning Research, 13(1): 1063-
1095. Disponível em: <https://www.jmlr.org/papers/volume13/biau12a/biau12a.pdf>. Acesso em: 21 fev. 2021.

Biau, G.; Scornet, E. 2016. A random forest guided tour. Test, 25(2): 197-227. Disponível em: <https://link.
springer.com/article/10.1007/s11749-016-0481-7>. Acesso em: 21 fev. 2021.

Breiman, L. 2001. Random forests. Machine learning, 45(1): 5-32. Disponível em: <https://link.springer.com/
article/10.1023/A:1010933404324>. Acesso em: 21 fev. 2021.

Genuer, R.; Poggi, J.M.; Tuleau-Malot, C. 2010. Variable selection using random forests. Pattern
recognition letters, 31(14): 2225-2236. Disponível em: <https://www.sciencedirect.com/science/article/
pii/S0167865510000954?casa_token=pPTgYLvNrfgAAAAA:9AqweZK802cdr1Njomtuj-SsfJrvS-mTG7_
r5mre0BuVb4dWqxSq-TD0KDf0AF9JB94JN91-Bw>. Acesso em: 21 fev. 2021.

Salles, T.; Gonçalves, M.; Rodrigues, V.; Rocha, L. 2018. Improving random forests by neighborhood projection
for effective text classification. Information Systems, 77(1): 1-21. Disponível em: <https://www.sciencedirect.
com/science/article/abs/pii/S030643791830156X>. Acesso em: 21 fev. 2021.

Shmueli, G.; Bruce, P.C.; Yahav, I.; Patel, N.R.; Lichtendanl, K.C. 2018. Data mining for business analytics:
concepts, techniques, and applications in R. John Wiley & Sons. New York, NY, USA.

Wager, S.; Athey, S. 2018. Estimation and inference of heterogeneous treatment effects using random
forests. Journal of the American Statistical Association, 113(523): 1228-1242. Disponível em: <https://www.
tandfonline.com/doi/abs/10.1080/01621459.2017.1319839>. Acesso em: 21 fev. 2021.

3.14. Bagging
Bagging é um dos procedimentos computacionalmente intensivos mais eficazes para melhorar
estimadores ou classificadores instáveis. Ele é útil, especialmente, para problemas de conjuntos
de dados de alta dimensão. O aluno pode analisar a relação entre a liquidez e a rentabilidade das
empresas listadas na B3, aplicar técnica Bagging e verificar se ela melhora os estimadores em seu TCC.
Além disso, também é possível aplicar esta técnica para tratar os outliers de um banco de dados, tendo
por base a pesquisa realizada por Aggarwal (2015), quando foi aplicado o método Bagging para tratar
os outliers. Ressalta-se que um outlier é uma observação que se desvia tanto das outras observações
a ponto de levantar suspeitas de que foi gerada por um mecanismo diferente. Por esse motivo, é
essencial saber como tratar esse tipo de observação na base de dados. Verificar a eficiência em se
utilizar o bagging para tratar outliers de uma amostra pode ser um dos objetivos de um TCC. Essa
eficiência pode ser verificada por meio da análise do desvio-padrão. Ou seja, se após a aplicação do
método bagging, o desvio-padrão diminuiu. Além disso, essa análise também pode ser utilizada ao
verificar os valores mínimos e máximos da amostra.

Referências
Aggarwal, C.C. 2015. Outlier analysis. In Data mining (pp. 237-263). Springer, Cham. Disponível em: <https://
link.springer.com/chapter/10.1007/978-3-319-14142-8_8>. Acesso em: 21 fev. 2021.

32
TCC em Data Science e Analytics: áreas e linhas de pesquisa

Bühlmann, P. 2012. Bagging, boosting and ensemble methods. In Handbook of computational statistics (pp.
985-1022). Springer, Berlin, Heidelberg. Disponível em: <https://link.springer.com/chapter/10.1007/978-3-642-
21551-3_33>. Acesso em: 21 fev. 2021.

Dudoit, S.; Fridlyand, J. 2003. Bagging to improve the accuracy of a clustering procedure. Bioinformatics, 19(9):
1090-1099. Disponível em: <https://academic.oup.com/bioinformatics/article/19/9/1090/284978?login=true>.
Acesso em: 21 fev. 2021.

Hothorn, T.; Lausen, B.; Benner, A.; Radespiel‐Tröger, M. 2004. Bagging survival trees. Statistics in
medicine, 23(1): 77-91. Disponível em: <https://onlinelibrary.wiley.com/doi/abs/10.1002/sim.1593?casa_toke-
n=MJKOVnYVSPQAAAAA:qhGEf77iP-GaWaeQpI2pl-Jvoh7nAfDW6YLUl75SLqfMGpjHF1sC1wXatwkkM_IaACVU-
yvnOyywb1k>. Acesso em: 21 fev. 2021.

Lee, T.H.; Yang, Y. 2006. Bagging binary and quantile predictors for time series. Journal of econometrics, 135(1):
465-497. Disponível em: <https://www.sciencedirect.com/science/article/pii/S0304407605001685?casa_token=-
nUotZ4CVWA8AAAAA:mGjEGV10gKxS9Uscq1d4QC2dD3TmXlivK5SVytblJ2fXT5eEgZpeghZ40NTFbuF1xnReha-
73mA>. Acesso em: 21 fev. 2021.

Shmueli, G.; Bruce, P.C.; Yahav, I.; Patel, N.R.; Lichtendanl, K.C. 2018. Data mining for business analytics:
concepts, techniques, and applications in R. John Wiley & Sons. New York, NY, USA.

Vega-Pons, S.; Ruiz-Shulcloper, J. 2011. A survey of clustering ensemble algorithms. International Journal of
Pattern Recognition and Artificial Intelligence, 25(3): 337-372. Disponível em: <https://www.worldscientific.com/
doi/abs/10.1142/S0218001411008683?casa_token=hKmnCdXG4A0AAAAA%3AaHeYkcD1VlAbfv7i_Ox29AT2QT
YvLunKgNxXJNrBJvvCNhACSWymr1fCKhinR_4a-hZniJpwRvE&>. Acesso em: 21 fev. 2021.

3.15. Boosting
Boosting é uma das ferramentas de machine learning que auxilia na transferência de aprendizagem.
Esse tipo de algoritmos é definido como um subconjunto de métodos de machine learning e que foram
aplicados com sucesso na comunidade de aprendizagem por transferência. É possível elaborar um
estudo de caso ao aplicar esta técnica para desenvolver um algoritmo que auxilie uma determinada
empresa no processo de transferência de aprendizagem. O TCC com essa temática poderia utilizar
como referência a pesquisa realizada por Al-Stouhi e Reddy (2011), quando resultou na aplicada essa
técnica em alguns dos pontos fracos dos algoritmos boosting com o objetivo de estender o algoritmo
de aumento de transferência mais popular, TrAdaBoost. O pesquisador pode combinar diversas fontes
de dados de forma a desenvolver um algoritmo de boosting mais robusto aplicado a um setor, por
exemplo, prestação de serviços. Para tal finalidade, sugiro como referencial teórico o estudo realizado
por Huang et al. (2012), que explora os problemas de aprendizagem por transferência com múltiplas
fontes de dados e apresentam um novo algoritmo de boosting, o SharedBoost. Este novo algoritmo é
capaz de aplicar dados dimensionais muito elevados, como em mineração de texto, em que a dimensão
do recurso está além de vários milhares.

Referências
Al-Stouhi, S.; Reddy, C.K. 2011. Adaptive boosting for transfer learning using dynamic updates. In Joint
European Conference on Machine Learning and Knowledge Discovery in Databases (pp. 60-75). Springer,
Berlin, Heidelberg. Disponível em: <https://link.springer.com/chapter/10.1007/978-3-642-23780-5_14>. Acesso
em: 21 fev. 2021.

Friedman, J.H. 2001. Greedy function approximation: a gradient boosting machine. Annals of statistics, 29(5):
1189-1232. Disponível em: <https://www.jstor.org/stable/2699986?seq=1>. Acesso em: 21 fev. 2021.

Huang, P.; Wang, G.; Qin, S. 2012. Boosting for transfer learning from multiple data sources. Pattern
Recognition Letters, 33(5): 568-579. Disponível em: <https://www.sciencedirect.com/science/article/pii/
S0167865511004132?casa_token=cmVdIN0TIcQAAAAA:O09XXTDvB8Yt8tH4ixvIqluqQdzSXdauxWPvYiiH3gwH-
jWgSsoblShrA2pu0mDhuRVks8aEJrg>. Acesso em: 21 fev. 2021.

33
R. B. dos Santos e F. Vasconcelos

Schapire, R.E. 2003. The boosting approach to machine learning: An overview. Nonlinear estimation and
classification. Springer, 149-171. Disponível em: <https://link.springer.com/chapter/10.1007/978-0-387-21579-
2_9>. Acesso em: 21 fev. 2021.

Schapire, R.E.; Freund, Y. 2013. Boosting: Foundations and algorithms. Kybernetes, 42(1): 1-24. Disponível
em: <https://www.emerald.com/insight/content/doi/10.1108/03684921311295547/full/html?casa_token=-
1J0UuO3Yge4AAAAA:nacP7tBgd2Rs58eY6Dz1NNZOp9nUAS4cMDQOuPrsaT6gx9N84JYazMntz1A2hwQUdy-
-PeQdh1VG72F1bKvpotQQ5ov4x2DW0LNu3qhz5Wl_WyRZtOks>.

Shmueli, G.; Bruce, P.C.; Yahav, I.; Patel, N.R.; Lichtendanl, K.C. 2018. Data mining for business analytics:
concepts, techniques, and applications in R. John Wiley & Sons., New York, NY, USA.

Tan, C.; Sun, F.; Kong, T.; Zhang, W.; Yang, C.; Liu, C. 2018. A survey on deep transfer learning. In International
conference on artificial neural networks. Springer, 270-279. Cham. Disponível em: <https://link.springer.com/
chapter/10.1007/978-3-030-01424-7_27>. Acesso em: 21 fev. 2021.

3.16. Redes Neurais


Em machine learning, as redes neurais artificiais são modelos computacionais inspirados pelo
sistema nervoso central de um animal que são capazes de realizar o aprendizado de máquina bem como
o reconhecimento de padrões. Em seu TCC, o aluno pode aplicar a técnica redes neurais para propor um
modelo de “credit scoring” para uma empresa do setor agrícola, usando como marco teórico a pesquisa
realizada por Gouvêa et al. (2013), na qual aplicaram e compararam as técnicas de regressão logística e
redes neurais no desenvolvimento de modelos de predição de “credit scoring” com base em dados de
grande instituição financeira brasileira. É possível realizar um levantamento por meio de questionário de
forma a verificar se as empresas utilizam e como fazem uso das redes neurais no processo de tomada
de decisão, com foco especial nas empresas com negócios digitais que utilizam essa ferramenta em
seus negócios. Também é viável propor no TCC um modelo de redes neurais para detectar fraudes em
cartões de crédito, problema que tem aumentado com a pandemia COVID-19. Por fim, o aluno também
tem a possibilidade de apresentar um modelo de redes neurais de forma que as empresas possam fazer
marketing mais direcionado e assim, aumentar seu volume de vendas.

Referências
Aggarwal, C.C. 2018. Neural networks and deep learning. Springer, 10: 978-3. Disponível em: <https://link.
springer.com/book/10.1007%2F978-3-319-94463-0>. Acesso em: 21 fev. 2021.

Gouvêa, M.A.; Gonçalves, E.B.; Mantovani, D.M.N. 2013. Análise de risco de crédito com aplicação de regressão
logística e redes neurais. Contabilidade Vista & Revista, 24(4): 96-123. Disponível em: <https://www.redalyc.org/
pdf/1970/197033497006.pdf>. Acesso em: 21 fev. 2021.

Jordan, M.I.; Mitchell, T.M. 2015. Machine learning: Trends, perspectives, and
prospects. Science, 349(1): 255-260. Disponível em: <https://science.sciencemag.org/
content/349/6245/255.abstract?casa_token=H8PMTRgFj3cAAAAA:BOSgdZtutYxHUuo82pgCNWF_
Bn5E30AbB4PWeyz9Cu8e31TQTHUlmCYUyIaS8PndLbipSgouJCTEhw>. Acesso em: 21 fev. 2021.

Meireles, M.R.G.; Cendón, B.V. 2010. Aplicação prática dos processos de análise de conteúdo e de análise de
citações em artigos relacionados às redes neurais artificiais. Informação & Informação, 15(2): 77-93. Disponível
em: <https://brapci.inf.br/index.php/article/view/0000009800/6b4286c89e6514b168332d36fe20c815>. Acesso
em: 21 fev. 2021.

Schmidhuber, J. 2015. Deep learning in neural networks: An overview. Neural network, 61(1): 85-117.
Disponível em: <https://www.sciencedirect.com/science/article/pii/S0893608014002135?casa_
token=iiIxsSn0OKUAAAAA:9M80mBdWIe_DFKKdj5PPh-VlE50-8zIkcIgioiPgFT-GjF9PztTfL8uBsfV-_
x1KdsNwo6oNig>. Acesso em: 21 fev. 2021.

Shmueli, G.; Bruce, P.C.; Yahav, I.; Patel, N.R.; Lichtendanl, K.C. 2018. Data mining for business analytics:
concepts, techniques, and applications in R. New York: John Wiley & Sons.

34
TCC em Data Science e Analytics: áreas e linhas de pesquisa

Tavanaei, A.; Ghodrati, M.; Kheradpisheh, S.R.; Masquelier, T.; Maida, A. 2019. Deep learning in spiking neural
networks. Neural Networks, 111(1): 47-63. Disponível em: <https://www.sciencedirect.com/science/article/pii/
S0893608018303332?casa_token=J-o16OZkiagAAAAA:Xw8BCrGEvSJNgFQUAJa09w9c2SBY3hvvpK3qcyCfSEL8B
wCj31nJhlCxgcFqKo7o0OnHgWA0EA>. Acesso em: 21 fev. 2021.

4. Outros Tópicos de Machine Learning e Deep Learning


Além dos tópicos e subtópicos apresentados até o momento, há outras oportunidades de pesquisa
que podem ser desenvolvidas no TCC, tais como: pesquisa operacional, modelos de otimização, modelos
de simulação, análise espacial, algoritmos e robôs, análise de mídias sociais, “text mining”, “webscraping”,
“web crawlers” e reconhecimento de imagem. A seguir serão apresentadas algumas oportunidades de
pesquisa que o aluno pode considerar para o desenvolvimento do TCC.

4.1. Pesquisa Operacional


A pesquisa operacional é um ramo de pesquisa que envolve diversas áreas que faz uso de
modelos matemáticos, estatísticos e de algoritmos para auxiliar na tomada de decisão. Um estudo
de caso pode ser realizado utilizando uma fábrica com a finalidade de propor um modelo de pesquisa
operacional que auxilie a empresa a determinar quais máquinas devem ser usadas para fabricar
determinado produto ou qual conjunto de produtos deve ser fabricado em uma fábrica durante
um período específico. Com esta finalidade, um estudo que pode servir de referencial teórico
foi realizado por Raymundo et al. (2015), que apresentou um modelo de otimização para apoiar
decisões de planejamento e controle de produção (PCP) em uma empresa produtora de uniformes,
conseguindo melhorar a capacidade produtiva da área de produção e ajudar na redução de custos.
No mesmo sentido, é possível propor um estudo de caso e apresentar um modelo de pesquisa
operacional que visa ajudar a empresa a resolver o problema de estoque, de forma a diminuir o
desperdício de material. Além disso, através de um levantamento feito por meio de questionário,
seria viável verificar no TCC se as empresas utilizam a técnica de pesquisa operacional para a tomada
de decisão e mapear quais as vantagens e desvantagens da sua utilização.

Referências
Antunes, M.T.P.; Martins, E. 2007. Capital intelectual: seu entendimento e seus impactos no desempenho de
grandes empresas brasileiras. Revista Base da UNISINOS, 4(1): 5-21. Disponível em: <https://www.redalyc.org/
pdf/3372/337228631002.pdf>. Acesso em: 21 fev. 2021.

Belfiore, P.; Fávero; L.P. 2012. Pesquisa operacional: para cursos de administração, contabilidade e economia.
Campus Elsevier, Rio de Janeiro, RJ, Brasil.

Belfiore, P.; Fávero; L.P. 2013. Pesquisa operacional: para cursos de engenharia. Campus Elsevier. Rio
de Janeiro, RJ, Brasil.

Borges, P.C.R. 2002. Métodos quantitativos de apoio à bibliometria: a pesquisa operacional pode ser uma
alternativa? Ciência da informação, 31(3): 5-17. Disponível em: <https://www.scielo.br/scielo.php?pid=S0100-
19652002000300001&script=sci_arttext>. Acesso em: 21 fev. 2021.

Karsu, Ö.; Morton, A. 2015. Inequity averse optimisation in operational research. European Journal of
Operational Research, 2(1): 343-359. Disponível em: <https://www.sciencedirect.com/science/article/abs/pii/
S0377221715001368>. Acesso em: 21 fev. 2021.

Kubrusly, L.S. 2001. Um procedimento para calcular índices a partir de uma base de dados
multivariados. Pesquisa Operacional, 21(1): 107-117. Disponível em: <https://www.scielo.br/scielo.
php?pid=S0101-74382001000100007&script=sci_arttext>. Acesso em: 21 fev. 2021.

Marins, F.A.S. 2011. Introdução a pesquisa operacional. Cultura Acadêmica: Universidade Estadual Paulista,
Pró-reitora de Graduação. São Paulo, SP, Brasil.

35
R. B. dos Santos e F. Vasconcelos

Raymundo, E.A.; Gonçalves, L.W.N.; Ribeiro, N.S. 2015. Pesquisa operacional na tomada de decisão: modelo
de otimização de produção e maximização do lucro. Revista de Gestão & Tecnologia, 3(1): 1-6. Disponível em:
<http://www.revista.unisal.br/lo/index.php/reget/article/view/169>. Acesso em: 21 fev. 2021.

Rezaei-Malek, M.; Tavakkoli-Moghaddam, R.; Cheikhrouhou, N.; Taheri-Moghaddam, A. 2016. An


approximation approach to a trade-off among efficiency, efficacy, and balance for relief pre-positioning
in disaster management. Transportation research part E: logistics and transportation review, 93(1):
485-509. Disponível em: <https://www.sciencedirect.com/science/article/pii/S136655451630134X?casa_
token=pRcxEH3If0EAAAAA:TsH8CHy_LJFx4Psy6m3-7TnduECJfha2Kv63VG2w59xq8wq54nnTzHo1F8QA7e1AXTf
cl_i-uw>. Acesso em: 21 fev. 2021.

4.2. Modelos de Otimização


Um dos objetivos dos modelos de otimização é ajudar a maximização de recursos de forma que
as organizações tomem melhores decisões, e assim, possam aumentar a rentabilidade do processo
produtivo e melhorar o aproveitamento dos recursos disponíveis. A realização de um estudo de caso
com a finalidade de aplicar os modelos de maximização que auxiliam a empresa na gestão de riscos
financeiros, seria um bom objetivo para um TCC. Diante disso, seria possível usar como referência
a pesquisa realizada por Kimura e Perera (2005) que propõem um modelo de otimização aplicado à
gestão de riscos por meio de uma estratégia de “hedge” que maximiza os lucros. A utilização de modelos
de maximização e aplicá-los no contexto de decisões de investimento de uma empresa também seria
interessante como TCC. Assim, o aluno teria a possibilidade de realizar um estudo de caso e fazer
simulações que auxiliam a empresa a escolher as melhores opções de investimento, tendo como
referência a pesquisa realizada por Yang et al. (2015), quando foi proposto um modelo para otimizar as
decisões de investimento de capital para uso de água para produção de gás.

Referências
Belfiore, P.; Fávero; L.P. 2012. Pesquisa operacional: para cursos de administração, contabilidade e economia.
Campus Elsevier, Rio de Janeiro, RJ, Brasil.

Belfiore, P.; Fávero; L.P. 2013. Pesquisa operacional: para cursos de engenharia. Campus Elsevier, Rio de
Janeiro, RJ, Brasil.

Camargo, L.A.S. 2015. Estratégias de comercialização e investimento, com ênfase em energias renováveis,
suportadas por modelos de otimização especializados para avaliação estocástica de risco x retorno (Doctoral
dissertation, Universidade de São Paulo). Disponível em: <https://www.teses.usp.br/teses/disponiveis/3/3143/
tde-14072016-135435/pt-br.php>. Acesso em: 21 fev. 2021.

Junqueira, L.; Morabito, R.; Yamashita, D.S. 2010. Modelos de otimização para problemas de carregamento
de contêineres com considerações de estabilidade e de empilhamento. Pesquisa Operacional, 30(1): 73-98.
Disponível em: <https://www.scielo.br/scielo.php?pid=S0101-74382010000100005&script=sci_arttext>. Acesso
em: 21 fev. 2021.

Kimura, H.; Perera, L.C.J. 2005. Modelo de otimização da gestão de risco em empresas não financeiras. Revista
Contabilidade & Finanças, 16(37): 59-72. Disponível em: <https://www.scielo.br/scielo.php?pid=S1519-
70772005000100005&script=sci_arttext&tlng=pt>. Acesso em: 21 fev. 2021.

Monsreal-Barrera, M.M.; Cruz-Mejia, O.; Ozkul, S.; Saucedo-Martínez, J.A. 2020. An optimization model for
investment in technology and government regulation. Wireless Networks, 26(7): 4929-4941. Disponível em: <
https://link.springer.com/article/10.1007/s11276-019-01958-z>. Acesso em: 21 fev. 2021.

Paulo, W.L.; Fernandes, F.C.; Silva, M.Z. 2017. Modelo de otimização de recursos financeiros para o
gerenciamento de riscos empresariais. Sistemas & Gestão, 12(1): 98-107. Disponível em: <https://www.
revistasg.uff.br/sg/article/view/1190>. Acesso em: 21 fev. 2021.

Yang, L.; Grossmann, I.E.; Mauter, M.S.; Dilmore, R.M. 2015. Investment optimization
model for freshwater acquisition and wastewater handling in shale gas production. AIChE
Journal, 61(6): 1770-1782. Disponível em: <https://aiche.onlinelibrary.wiley.com/doi/full/10.1002/

36
TCC em Data Science e Analytics: áreas e linhas de pesquisa

aic.14804?casa_token=qj6mdPxBwDwAAAAA%3A4GMxEdO-p7nZHe7fpsFQ5yW4VzQWUPYdQmvlgYtr-NwrujI
zTijvEHKEbMa3CDZWffi0TasHAFgC4_8> Acesso em: 21 fev. 2021.

4.3. Modelos de Simulação


Outra ferramenta importante em Data Science são os modelos de simulação. A sua utilização
permite que outros cenários sejam explorados. A aplicação de modelos de simulação no contexto de
uma empresa que faz gestão de cadeias de suprimentos seria uma boa sugestão para um TCC. Por meio
destas simulações, será possível encontrar maneiras de melhorar a cadeia de suprimentos, com base
teórica nos estudos realizados por Oliveira et al. (2004), que analisou as políticas de gestão em cadeias
de suprimentos por modelos de simulação e identificou que a troca de informação entre as empresas da
cadeia de suprimentos aumenta a agilidade e a produtividade das empresas. Os modelos de simulação
também podem ser utilizados no contexto de fusões, a partir de simulação em empresas que estejam
no processo de fusão ou que já o tenha concluído efetivamente, com a finalidade de propor melhorias
nas suas etapas procedimentais. Como referência sobre o tema, sugiro a pesquisa de Souza et al. (2019),
a qual demonstra como utilizar modelos de demanda e oferta em simulações no contexto de fusões,
tendo por base a fusão que originou a Ambev.

Referências
Murray, E.J.; Robins, J.M.; Seage III, G. R.; Lodi, S.; Hyle, E.P.; Reddy, K.P.; Hernán, M.A. 2018. Using
observational data to calibrate simulation models. Medical Decision Making, 38(2): 212-224.
Disponível em: < https://journals.sagepub.com/doi/full/10.1177/0272989X17738753?casa_
token=9Mh2S1f58UIAAAAA%3A1GttG2Tjzos2B9k0hDJKo16tjl5GV6r993tDbRBM6dNCoAX5BD_
HUtvYmExqYvDxGQ1BlyVGSpUb>. Acesso em: 21 fev. 2021.

Oliveira, C.M.D.; Carvalho, M.F.H.D. 2004. Análise de políticas de gestão em cadeias de suprimentos por
modelos de simulação. Gestão & produção, 11(3): 313-329. Disponível em: < https://www.scielo.br/scielo.
php?pid=S0104-530X2004000300006&script=sci_arttext&tlng=pt>. Acesso em: 21 fev. 2021.

Pel, A.J.; Bliemer, M.C.; Hoogendoorn, S.P. 2012. A review on travel behaviour modelling in dynamic traffic
simulation models for evacuations. Transportation, 39(1): 97-123. Disponível em: <https://link.springer.com/
article/10.1007/s11116-011-9320-6>. Acesso em: 21 fev. 2021.

Sargent, R.G. 2013. Verification and validation of simulation models. Journal of simulation, 7(1): 12-24.
Disponível em: <https://link.springer.com/article/10.1057/jos.2012.20>. Acesso em: 21 fev. 2021.

Schramm, F.K.; Formoso, C.T. 2015. Projeto de sistemas de produção na construção civil empregando
simulação no apoio à tomada de decisão. Ambiente Construído, 15(4): 165-182. Disponível em: <https://www.
scielo.br/scielo.php?pid=S1678-86212015000400165&script=sci_arttext&tlng=pt>. Acesso em: 21 fev. 2021.

Souza, S.A.; Salgado, L.H. 2019. Uso da simulação para análise ex-post de fusões: simulação e aplicação ao caso
AMBEV. Economic Analysis of Law Review, 10(1): 158-174. Disponível em: <https://portalrevistas.ucb.br/index.
php/EALR/article/view/8953>. Acesso em: 21 fev. 2021.

4.4. Análise Espacial


No conjunto de ferramentas de Data Science há análise espacial. Essa ferramenta é útil para
resolver problemas que envolve espaço geográfico. A análise espacial ou estatística espacial é formada
por análises topológicas, geométricas ou geográficas. Desta forma, é possível realizar um estudo de
caso em uma fábrica de maneira que seja realizada uma análise espacial que mostre como ela pode
utilizar melhor seu espaço físico, tendo como referencial teórico o estudo de Giorotto et al. (2017), que
por meio da análise espacial, realizaram o projeto “A Reorganização Escolar em Mapas”, desenvolvido
no Laboratório de Ensino e Material Didático (LEMADI) do Departamento de Geografia da USP”, com
propósito de demonstrar a importância da análise espacial na compreensão das políticas educacionais.
Também é possível realizar um estudo de caso em uma empresa de transporte marítimo de forma
a propor maneiras de aumentar sua produtividade com base na análise espacial, tendo por marco

37
R. B. dos Santos e F. Vasconcelos

investigativo o estudo de Silva et al. (2019), que realizou uma pesquisa com o objetivo de avaliar se o
nível de serviço do porto de Manaus Moderna está de acordo com a expectativa das embarcações aquela
doca ali, de acordo com seus comandantes.

Referências
Cardoso, P.V.; Seabra, V.S.; Bastos, I.B.; Costa, E.D.C.P. 2020. A importância da análise espacial para tomada de
decisão: um olhar sobre a pandemia de COVID-19. Revista Tamoios, 16(1): 125-137. Disponível em: <https://
www.e-publicacoes.uerj.br/index.php/tamoios/article/view/50440>. Acesso em: 21 fev. 2021.

Cordes, J.; Castro, M.C. 2020. Spatial analysis of COVID-19 clusters and contextual factors in New York
City. Spatial and Spatio-temporal Epidemiology, 34(1): 1-8. Disponível em: <https://www.sciencedirect.com/
science/article/pii/S1877584520300332?casa_token=bnbQYOnrkOgAAAAA:_3xXRyDOXRK-LwNPIRVnkXwuS46
brnGKarw1fEbfYnqGmy7YNmyRmbJ8Riu2Ldv7BxFnKh0N4g>. Acesso em: 21 fev. 2021.

Franch-Pardo, I.; Napoletano, B.M.; Rosete-Verges, F.; Billa, L. 2020. Spatial analysis and GIS in the study of
COVID-19. A review. Science of The Total Environment, 739(1): 1-10. Disponível em: <https://www.sciencedirect.
com/science/article/pii/S0048969720335531>. Acesso em: 21 fev. 2021.

Girotto, E.D.; Passos, F.G.; Campos, L.; Oliveira, J.V.P. 2017. A geografia da reorganização escolar: uma análise
espacial a partir da cidade de São Paulo. ETD-Educação Temática Digital, 19(1): 134-158. Disponível em:
<https://periodicos.sbu.unicamp.br/ojs/index.php/etd/article/view/8647805/0>. Acesso em: 21 fev. 2021.

Maddikunta, P.K.R.; Gadekallu, T.R.; Al-Ahmari, A.; Abidi, M.H. 2020. Location based business recommendation
using spatial demand. Sustainability, 12(10): 1-12. Disponível em: <https://www.mdpi.com/2071-
1050/12/10/4124>. Acesso em: 21 fev. 2021.

Silva, D.N.; Ferreira, T.S.; Martins, G.B.; Soares, M.L.; Pereira, D.R 2019. Analysis of the Service Level of
the Manaus Moderna Port: The Perception of the Amazon Vessel Commanders. International Journal of
Advanced Engineering Research and Science (IJAERS). Disponível em: <https://www.researchgate.net/profile/
Daniel-Nascimento-E-Silva/publication/338345222_Analysis_of_the_Service_Level_of_the_Manaus_Moderna_
Port_The_Perception_of_the_Amazon_Vessel_Commanders/links/5e0e3efd299bf10bc38c1af0/Analysis-of-the-
Service-Level-of-the-Manaus-Moderna-Port-The-Perception-of-the-Amazon-Vessel-Commanders.pdf>. Acesso
em: 21 fev. 2021.

4.5. Algoritmos e Robôs


Nos últimos anos, os algoritmos têm assumido um papel fundamental na gestão dos negócios.
Especialmente, na relação das empresas com os consumidores, pois os algoritmos auxiliam na
recomendação de produtos e serviços que tenham mais aderência com o perfil de cada cliente. Com
isso, os negócios ganham mais agilidade e rentabilidade. O pesquisador pode realizar um levantamento
por meio de questionários para verificar se as empresas utilizam algoritmos ou robôs para recomendar
produtos aos seus clientes. Há também a possibilidade de desenvolver um algoritmo que auxilie a
empresa no processo de lançar um novo produto no mercado, com base teórica na pesquisa de Abensur
(2006) que utilizou a inteligência artificial para experimentar e testar novos produtos financeiros.
No mesmo sentido, é possível desenvolver um algoritmo que auxilie a empresa em caso de litígios
trabalhistas e testar sua capacidade preditiva, tal como no estudo realizado por Engelmann e Fröhlich
(2020) que demonstrou como a inteligência artificial pode ser aplicada em âmbito da decisão judicial.

Referências
Abensur, E.D.O. 2006. Experimentaçao e Testes para o Desenvolvimento de Novos Produtos Financeiros.
Doctoral dissertation, Tese de Doutorado, Escola Politécnica da Universidade de São Paulo, SP, Brasil.
Disponível em: <https://teses.usp.br/teses/disponiveis/3/3136/tde-13122006-154755/pt-br.php. Acesso em: 21
fev. 2021.

Barcelos, R.; Tarouco, L.; Bercht, M. 2009. O uso de mobile learning no ensino de algoritmos. RENOTE-Revista
Novas Tecnologias na Educação, 7(3): 327-337. Disponível em: <https://www.seer.ufrgs.br/renote/article/
view/13573>. Acesso em: 21 fev. 2021.

38
TCC em Data Science e Analytics: áreas e linhas de pesquisa

Engelmann, W.; Fröhlich, A.V.K. 2020. Inteligência artificial aplicada à decisão judicial: o papel dos algoritmos no
processo de tomada de decisão. Revista Jurídica (FURB), 24(54): 1-27. Disponível em: <https://bu.furb.br/ojs/
index.php/juridica/article/view/8274>. Acesso em: 21 fev. 2021.

Fukumoto, G.Y.; Langhi, P.P. 2015. Teoria Dos Grafos Na Tomada De Decisão. ETIC - Encontro de Iniciação
Científica, 11(11): 1-16. Disponível em: <http://intertemas.toledoprudente.edu.br/index.php/ETIC/article/
view/4798>. Acesso em: 21 fev. 2021.

Kretzer, F.M.; von Wangenheim, C.G.; Hauck, J.C.; Pacheco, F.S. 2020. Formação Continuada de Professores
para o Ensino de Algoritmos e Programação na Educação Básica: Um Estudo de Mapeamento
Sistemático. Revista Brasileira de Informática na Educação, 28(1): 389-419. Disponível em: <https://www.br-ie.
org/pub/index.php/rbie/article/view/v28p389>. Acesso em: 21 fev. 2021.

von Wangenheim, C.G.; Araújo, G.; Medeiros, S.; Missfeldt, R.F.; Petri, G.; Pinheiro, F.C.; Hauck, J.C. 2019.
Desenvolvimento e Avaliação de um Jogo de Tabuleiro para Ensinar o Conceito de Algoritmos na Educação
Básica. Revista Brasileira de Informática na Educação, 27(3): 310-335. Disponível em: <https://br-ie.org/pub/
index.php/rbie/article/view/v27n03310335>. Acesso em: 21 fev. 2021.

4.6. Análises de Mídias


Nas últimas décadas houve grande aumento na utilização das mídias sociais. Esse contexto é
propício para a utilização do Big Data, pois as redes sociais é uma mina de ouro dos dados. Sendo assim,
a utilização de ferramentas de Big Data auxilia na escolha das melhores estratégicas para os negócios.
É possível desenvolver uma pesquisa com levantamento de informações por meio de questionário
para verificar se as empresas, que utilizam mídias sociais, fazem análise dos dados obtidos delas. Outra
oportunidade de pesquisa é analisar o sentimento dos clientes nas redes sociais, tendo como marco
referencial o estudo de Feldman (2013) que analisa como os sentimentos constantes nas interações dos
usuários das mídias sociais podem auxiliar as empresas na tomada de decisão. Por outro lado, um dos
desafios das mídias sociais são as Fake News, razão pela qual é possível realizar um estudo para analisar
uma mídia social e verificar se grupos estão espalhando notícias falsas, tendo como base na pesquisa de
Ahmad et al. (2019) que aplicaram a análise de mídias para detectar e classificar afiliações extremistas
baseadas em mídia social usando técnicas de análise de sentimento no Tweet. No mesmo sentido, é
possível realizar um levantamento com o objetivo de verificar se as empresas são as afetadas pelas fake
news nas mídias sociais. Por fim, o aluno tem a possibilidade de mapear as práticas e técnicas de análise
de mídias nas empresas no Brasil.

Referências
Ahmad, S.; Asghar, M.Z.; Alotaibi, F.M.; Awan, I. 2019. Detection and classification of social media-based
extremist affiliations using sentiment analysis techniques. Human-centric Computing and Information
Sciences, 9(1): 1-23. Disponível em: <https://hcis-journal.springeropen.com/articles/10.1186/s13673-019-0185-
6>. Acesso em: 21 fev. 2021.

Batrinca, B.; Treleaven, P.C. 2015. Social media analytics: a survey of techniques, tools and platforms. Ai &
Society, 30(1): 89-116. Disponível em: <https://link.springer.com/article/10.1007%2Fs00146-014-0549-4>.
Acesso em: 21 fev. 2021.

Feldman, R. 2013. Techniques and applications for sentiment analysis. Communications of the ACM, 56(4):
82-89. Disponível em: <https://dl.acm.org/doi/fullHtml/10.1145/2436256.2436274?casa_token=uagoFZXcCEo-
AAAAA:Pb4C_0l418DJQQcJrlO7fjrUGpoiDeOCHoq_9FG9vtEC2GhgS96tpvi9kH6XlZMbNBqcyrOTGixy>. Acesso
em: 21 fev. 2021.

Manovich, L. 2012. Media visualization: Visual techniques for exploring large media collections. The
international encyclopedia of media studies. Disponível em: <https://onlinelibrary.wiley.com/doi/
abs/10.1002/9781444361506.wbiems144>. Acesso em: 21 fev. 2021.

Peng, Y.X.; Zhu, W.W.; Zhao, Y.; Xu, C.S.; Huang, Q.M.; Lu, H.Q.; Gao, W. 2017. Cross-media analysis and
reasoning: advances and directions. Frontiers of Information Technology & Electronic Engineering, 18(1): 44-57.
Disponível em: <https://link.springer.com/article/10.1631/FITEE.1601787>. Acesso em: 21 fev. 2021.

39
R. B. dos Santos e F. Vasconcelos

4.7. Text Mining


Em Data Science há uma ferramenta voltada para análise de textos, conhecida por “Text Mining”.
Ela também pode ser chamada de mineração de dados textuais, é semelhante à análise de texto,
utilizada para obtenção de informações importantes de um texto. Desta forma, é cabível a realização de
entrevistas para verificar se as empresas utilizam a ferramenta “Text Mining” para a tomada de decisão.
A aplicação desta ferramenta para prever a demanda do mercado por determinado produto ou serviço
também seria uma boa sugestão de tema, tendo como referência a pesquisa de Nassirtoussi et al. (2014),
que demonstrou como essa ferramenta pode auxiliar as empresas a tomarem melhores decisões em
relação às tendências de mercado. Assim, a ferramenta “Text Mining” pode ser amplamente aplicada no
contexto de marketing, razão pela qual a realização de um levantamento com empresas de e-commerce,
para verificar se elas utilizam a ferramenta “Text Mining” para o planejamento das ações de marketing da
empresa seria um bom tema para um TCC.

Referências
Amado, A.; Cortez, P.; Rita, P.; Moro, S. 2018. Research trends on Big Data in Marketing: A text
mining and topic modeling based literature analysis. European Research on Management and
Business Economics, 24(1): 1-7. Disponível em: <https://www.sciencedirect.com/science/article/pii/
S2444883417300268>. Acesso em: 21 fev. 2021.

Bach, M.P.; Krstić, Ž.; Seljan, S.; Turulja, L. 2019. Text mining for big data analysis in financial sector: A literature
review. Sustainability, 11(5): 1-27. Disponível em: <https://www.mdpi.com/2071-1050/11/5/1277>. Acesso em:
21 fev. 2021.

Gupta, A.; Dengre, V.; Kheruwala, H.A.; Shah, M. 2020. Comprehensive review of text-mining applications in
finance. Financial Innovation, 6(1): 1-25. Disponível em: <https://jfin-swufe.springeropen.com/articles/10.1186/
s40854-020-00205-1>. Acesso em: 21 fev. 2021.

Moro, S.; Pires, G.; Rita, P.; Cortez, P. 2019. A text mining and topic modelling perspective of ethnic marketing
research. Journal of Business Research, 103(1): 275-285. Disponível em: <https://www.sciencedirect.com/
science/article/pii/S0148296319300724?casa_token=w0DKSjzmeuwAAAAA:ulQ8KA5PJwFY0SDQNkGR-
ESdKvqythCZkJlTr1Zjhn_yiWlkMO70Eh4VKgrwhfKeWa9Y4gLn5g>. Acesso em: 21 fev. 2021.

Nassirtoussi, A.K.; Aghabozorgi, S.; Wah, T.Y.; Ngo, D.C.L. 2014. Text mining for market prediction:
A systematic review. Expert Systems with Applications, 41(16): 7653-7670. Disponível em:
<https://www.sciencedirect.com/science/article/pii/S0957417414003455?casa_token=tY_
KBuo7NeEAAAAA:dGnvVWphwLW44KbmWjxMRE7lL82H3BXGW__P56ynndWlg8lvUow7bC5nFrKtKPQOpo-
RbHeODQ>. Acesso em: 21 fev. 2021.

Ying, H.; Chen, L.; Zhao, X. 2020. Application of text mining in identifying the factors of
supply chain financing risk management. Industrial Management & Data Systems, 121(2):
498-518. Disponível em: <https://www.emerald.com/insight/content/doi/10.1108/IMDS-06-
2020-0325/full/html?casa_token=stMhRvAy5l0AAAAA:9iYuy-NIzyg9YNLHlleLZjdMpqNe6A_
sFFxCwbXGhQxABw0Guia4w0VQeT1lec1O6nYizKpYod5GebRqYuq7bvlrKG3h8AaPF5oXn0UtoS6yVsGedmA>.
Acesso em: 21 fev. 2021.

4.8. Webscraping
“Webscraping” é outra técnica utilizada para coleta de dados em sites. Por meio dela é possível
copiar vastos dados em que as informações são copiadas diretamente da web, gerando assim um
banco informações ou uma planilha para análise. Desta forma, há possibilidade de desenvolver no TCC
um “webscraping” que auxilie cooperativas de crédito a coletar dados que as auxiliem no processo de
concessão de crédito para seus clientes. Também seria viável um estudo de caso com uma empresa que
utiliza “webscraping” de forma a verificar quais são os benefícios e desafios em utilizar essa ferramenta
no processo de tomada de decisão, usando como referência o estudo realizado por Gyódi (2019) que
utilizou a referida técnica para examinar as características das redes Airbnb, no contexto do impacto
potencial sobre os residentes e a indústria hoteleira tradicional. A referida pesquisa pode ser realizada

40
TCC em Data Science e Analytics: áreas e linhas de pesquisa

com análise de outros contextos, por exemplo, o impacto do Uber na vida dos seus motoristas. Por fim,
demonstrar como a ferramenta “webscraping” pode auxiliar as empresas no processo de tomada de
decisão com relação à construção de novas filiais da empresa ou outras questões relacionadas com
negócios seria um tema interessante de pesquisa para um TCC.

Referências
Ensari, E.; Kobaş, B. 2018. Web scraping and mapping urban data to support urban design decisions. A| Z
ITU Journal of Faculty of Architecture, 15(1): 5-21. Disponível em: < https://jag.journalagent.com/itujfa/pdfs/
ITUJFA_15_1_5_21.pdf>. Acesso em: 21 fev. 2021.

Gyódi, K. 2019. Airbnb in European cities: Business as usual or true sharing economy? Journal of
Cleaner Production, 221(1): 536-551. Disponível em: <https://www.sciencedirect.com/science/article/pii/
S0959652619306213?casa_token=ye4SHFSHEiIAAAAA:oPt8PodmuCtY-dBGWppyOMKar09U6Z3pef1zThvWYYll
9qefK6d6NBI_PEf5ZH5a-TG7dZZX2g>. Acesso em: 21 fev. 2021.

Krotov, V.; Johnson, L. Silva, L. 2020. Tutorial: Legality and Ethics of Web Scraping. Communications of the
Association for Information Systems, 47(1): 1-26. Disponível em: <https://aisel.aisnet.org/cais/vol47/iss1/22/>.
Acesso em: 21 fev. 2021.

Krotov, V.; Tennyson, M. 2018. Research note: scraping financial data from the web using the R
language. Journal of Emerging Technologies in Accounting, 15(1): 169-181. Disponível em: <https://meridian.
allenpress.com/jeta/article-abstract/15/1/169/9429>. Acesso em: 21 fev. 2021.

Lin, G.; Liang, Y.; Fu, X.; Chen, G.; Cai, S. 2019. Design of a Daily Brief Business Report Generator based on
Web Scraping with KNN Algorithm. Journal of Physics, 1(1): 1-8. Disponível em: <https://iopscience.iop.org/
article/10.1088/1742-6596/1345/5/052064/meta>. Acesso em: 21 fev. 2021.

Saurkar, A.V.; Pathare, K.G.; Gode, S.A. 2018. An Overview On Web Scraping Techniques And
Tools. International Journal on Future Revolution in Computer Science & Communication Engineering, 4(4):
363-367. Disponível em: <http://www.ijfrcsce.org/download/browse/Volume_4/April_18_Volume_4_
Issue_4/1524638955_25-04-2018.pdf>. Acesso em: 21 fev. 2021.

4.9. Web Crawlers


Uma das ferramentas utilizadas na análise de dados é a Web Crawlers, também conhecida por
rastreador da rede. Esta ferramenta é um programa de computador que navega pela rede mundial de
maneira metódica e automatizada. Em resumo, Web Crawlers é um algoritmo usado pelos buscadores
para encontrar, ler e indexar páginas de um site. Nas últimas décadas, tem-se aumentado cada vez
mais a utilização da Web Crawlers no processo de tomada de decisão, razão pela qual o aluno pode
desenvolver um algoritmo que auxilie a empresa na tomada de decisão no sentido de aumentar ou não
o preço de um produto, uma vez que a partir das informações dos sites de empresas concorrentes será
possível tomar uma decisão mais assertiva. Outra possibilidade de pesquisa para o TCC seria desenvolver
um algoritmo que ajude as empresas a realizar negociações mais inteligentes ao coletar dados dos sites
da empresa, na qual a empresa está negociando, retornando uma vantagem competitiva que auxilia
a empresa em seu contexto de negócio. Por fim, seria viável também realizar um levantamento por
meio de questionário e verificar se as empresas percebem que a utilização de Web Crawlers cria valor
para a empresa, tendo como referência teórica a pesquisa de Saggi e Jain (2015) que demonstrou que
utilizar ferramenta de Big Data, inclusive os Web Crawlers, geram valor para as empresas. Se o aluno
pesquisador preferir seria factível realizar um estudo de caso de forma a verificar como determinada
empresa utiliza o Web Crawlers em seu processo de tomada de decisão e se ao utilizar essa ferramenta,
houve agregação de valor.

Referências
Almeida, F. 2018. Big data: Concept, potentialities and vulnerabilities. Emerging Science Journal, 2(1): 1-10.
Disponível em: <https://www.ijournalse.org/index.php/ESJ/article/view/58>. Acesso em: 21 fev. 2021.

41
R. B. dos Santos e F. Vasconcelos

Chen, Y.J.; Liou, W.C.; Chen, Y.M.; Wu, J.H. 2019. Fraud detection for financial statements of business
groups. International Journal of Accounting Information Systems, 32(1): 1-23. Disponível em: <https://www.
sciencedirect.com/science/article/pii/S1467089517300866?casa_token=vlAFOxPXbCwAAAAA:4yTNoH0e-zhm7
ZfYRjima8WNHiNbsIa4f6LIszoZeSppegr7IRCichHbVgVIUIWnVWrBNn92tA>. Acesso em: 21 fev. 2021.

Kumar, M.; Bhatia, R.; Rattan, D. 2017. A survey of Web crawlers for information retrieval. Wiley Interdisciplinary
Reviews: Data Mining and Knowledge Discovery, 7(6): 1-45. Disponível em: <https://onlinelibrary.wiley.com/doi/
full/10.1002/widm.1218?casa_token=vJUJR8Au_AQAAAAA%3As9yb6foliEhWjmXgsHa2NiKbLsvKbICecTvmhlGx
H45kzegGJpU3WE7ZOlr5S8P-IyUMhDYzudQa6tk>. Acesso em: 21 fev. 2021.

Ponti, G.; Santomauro, G.; Ambrosino, F.; Bracco, G.; Colavincenzo, A.; Rosa, M.; Migliori, S. 2018. A Web
Crawling Environment to Support Financial Strategies and Trend Correlation. In ECML PKDD 2018, 1(1):
103-107. Disponível em: <https://link.springer.com/chapter/10.1007/978-3-030-13463-1_8>. Acesso em:
21 fev. 2021.

Saggi, M.K.; Jain, S. 2018. A survey towards an integration of big data analytics to big insights for value-
creation. Information Processing & Management, 54(5): 758-790. Disponível em: <https://www.sciencedirect.
com/science/article/abs/pii/S0306457316307178>. Acesso em: 21 fev. 2021.

Tian, X.; Han, R.; Wang, L.; Lu, G.; Zhan, J. 2015. Latency critical big data computing in finance. The Journal of
Finance and Data Science, 1(1): 33-41. Disponível em: <https://www.sciencedirect.com/science/article/pii/
S2405918815000045>. Acesso em: 21 fev. 2021.

4.10. Reconhecimento de Imagem


Uma das áreas de machine learning que tem ganhado espaço na análise de dados é o
Reconhecimento de Imagem. Por meio desta ferramenta é possível reconhecer e classificar imagens
por meio de deep learning, o que traz mais informações para a análise de dados e para a tomada de
decisão. O aluno tem a oportunidade de promover um estudo de caso com uma empresa de auditoria
que utiliza o reconhecimento de imagem nos processos de fiscalização, para fins de verificar quais são os
ganhos e desafios que ela obteve ao adotar esta técnica de machine learning. Para esse estudo, pode-se
utilizar como base a pesquisa de Issa et al. (2016) que apresenta um panorama de como a inteligência
artificial tem mudado o mundo da auditoria e traz algumas reflexões sobre suas aplicações. Há também
a viabilidade de aplicar um questionário para identificar quais as principais barreiras para empresas
adotarem essa técnica, em diversos setores da economia, tais como: saúde, finanças ou segurança
da informação. Por fim, há possibilidade de realizar um estudo de caso com empresas que utilizam
reconhecimento de imagem, tais como Samsung e Gol, e verificar como se deu o processo de implantar
essa técnica em seus negócios e apresentar os ganhos que elas obtiveram com isso.

Referências
Issa, H.; Sun, T.; Vasarhelyi, M.A. 2016. Research ideas for artificial intelligence in auditing: The formalization of
audit and workforce supplementation. Journal of Emerging Technologies in Accounting, 13(2): 1-20. Disponível
em: <https://meridian.allenpress.com/jeta/article/13/2/1/115980/Research-Ideas-for-Artificial-Intelligence-in>.
Acesso em: 21 fev. 2021.

Kaufman, D. 2020. Inteligência artificial: repensando a mediação. Brazilian Journal of Development, 6(9):
66742-66760. Disponível em: <https://www.brazilianjournals.com/index.php/BRJD/article/view/16372>. Acesso
em: 21 fev. 2021.

Mao, Q.; Pan, Z.; Si, D.; Kong, X. 2020. Research on Image Recognition Algorithm Technology for Power Line
Business Audit. In Journal of Physics: Conference Series, 1650(3): 1-9. Disponível em: <https://iopscience.iop.
org/article/10.1088/1742-6596/1650/3/032002/meta>. Acesso em: 21 fev. 2021.

Monteiro, L.A.F. 2020. Inteligência artificial: a importância do reconhecimento facial na educação. Revista
Presença Geográfica, 7(1): 1-14. Disponível em: <https://periodicos.unir.br/index.php/RPGeo/article/
view/5317>. Acesso em: 21 fev. 2021.

Porto, F.R. 2018. O impacto da utilização da inteligência artificial no executivo fiscal. Estudo de caso do Tribunal
de Justiça do Rio de Janeiro. Direito e Movimento, Rio de Janeiro, 17(1): 142-199. Disponível em: <https://www.

42
TCC em Data Science e Analytics: áreas e linhas de pesquisa

emerj.tjrj.jus.br/revistadireitoemovimento_online/edicoes/volume17_numero1/volume17_numero1_142.pdf>.
Acesso em: 21 fev. 2021.

Silveira, J.S.; Sá, A.A.R. 2018. Reconhecimento Facial utilizando o algoritmo Eigenface da biblioteca Open
CV. Revista Eletrônica Argentina-Brasil de Tecnologias da Informação e da Comunicação, 1(9): 1-16. Disponível
em: <https://revistas.setrem.com.br/index.php/reabtic/article/view/294>. Acesso em: 21 fev. 2021.

5. Tecnologia de Negócios
Nos últimos anos, a tecnologia evoluiu de maneira expoente de forma que atualmente é quase
impossível pensar fazer negócios sem considerá-la. Assim, a Tecnologia de Negócios é o novo cenário
no qual as empresas estão inseridas. Desta forma, a tecnologia impulsiona e permite a criação de novos
negócios. A utilização de tecnologia de negócios não é mais uma questão de vantagem competitiva, mas
sim de sobrevivência. A seguir serão apresentadas algumas possibilidades de pesquisa nesta temática
que podem ser consideradas ao desenvolver o seu TCC.

5.1. Cloud Computing


O “Cloud Computing”, ou computação em nuvem, refere-se aos recursos do sistema de
computador, mais especificamente, armazenamento de dados e capacidade de computação, sem o
gerenciamento ativo direto do utilizador. Assim, antes do advento Cloud Computing, as empresas
precisavam investir em grandes estruturas de servidor para armazenar e ter acesso aos sistemas.
Agora, tudo isso pode ser feito por meio desta nova tecnologia. Desta forma, como TCC é possível fazer
um levantamento por meio de questionário ou entrevistas de forma a verificar se as empresas utilizam
computação na nuvem em seus processos, especialmente, porque com o COVID-19, muitas empresas
passaram a utilizar o formato de trabalho home office. Neste sentido, pode-se fazer uma comparação
de dois grupos de empresa: a)empresas que utilizam computação em nuvem, e b)empresas que
não utilizam esta tecnologia, com o objetivo de verificar se as que utilizam computação em nuvem
apresentam melhor desempenho financeiro ou não, tendo por base o estudo realizado por Attaran
(2017) que analisou como a utilização da computação em nuvem pode aumentar o desempenho dos
negócios, inclusive com a apresentação dos benefícios estratégicos e potenciais dessa tecnologia, além
de destacar as tendências em evolução e seu impacto no futuro. Por meio de estudo de caso também
há viabilidade de realizar um estudo sobre o impacto da utilização da computação em nuvem no
ecossistema no qual a empresa está inserida, com base o estudo de Nieuwenhuis et al. (2018), que
demonstrou como a tecnologia disruptiva, computação em nuvem, afeta o ecossistema de negócios
de software empresarial. Os autores concluem que o consumidor de computação em nuvem pode
se concentrar em seu negócio principal, mas precisa considerar a aplicação de processos de práticas
recomendadas ao receber serviços públicos da nuvem.

Referências
Attaran, M. 2017. Cloud computing technology: leveraging the power of the internet to improve business
performance. Journal of International Technology and Information, Management 26(1): 112-137. Disponível
em: <https://scholarworks.lib.csusb.edu/jitim/vol26/iss1/6/>. Acesso em: 21 fev. 2021.

Davenport, T.H. 2018. From analytics to artificial intelligence. Journal of Business Analytics, 1(2): 73-80.
Disponível em: <https://orsociety.tandfonline.com/doi/full/10.1080/2573234X.2018.1543535?src=recsys#.
YGDMJK9KjIU>. Acesso em: 21 fev. 2021.

Garbuio, M.; Lin, N. 2019. Artificial intelligence as a growth engine for health care startups: Emerging business
models. California Management Review, 61(2): 59-83. Disponível em: <https://journals.sagepub.com/doi/
full/10.1177/0008125618811931?casa_token=Nid7ndi4w-sAAAAA%3ABCIC4HYXVRECW8JZ8etlCB1XFYudR49Af
Enq1F1M2i49tVc8jz6-H3YyKUiVXT4ch8FMlsa9em9a>. Acesso em: 21 fev. 2021.

43
R. B. dos Santos e F. Vasconcelos

Haseeb, M.; Hussain, H.I.; Ślusarczyk, B.; Jermsittiparsert, K. 2019. Industry 4.0: A solution towards technology
challenges of sustainable business performance. Social Sciences, 8(5): 1-24. Disponível em: <https://www.mdpi.
com/2076-0760/8/5/154>. Acesso em: 21 fev. 2021.

Hughes-Cromwick, E.; Coronado, J. 2019. The value of US government data to US business decisions. Journal
of Economic Perspectives, 33(1): 131-46. Disponível em: <https://www.aeaweb.org/articles?id=10.1257/
jep.33.1.131>. Acesso em: 21 fev. 2021.

Nieuwenhuis, L.J.; Ehrenhard, M.L.; Prause, L. 2018. The shift to Cloud Computing: The impact of disruptive
technology on the enterprise software business ecosystem. Technological forecasting and social change,
129(1): 308-313. Disponível em: <https://www.sciencedirect.com/science/article/pii/S004016251731466X?casa_
token=d9fPdsRIwoAAAAAA:Wz9JhtWmK5PuqoZzTI7zWCXPVysxESHeh5G8nk_-Tq2GqzPWLM2aIrWDNWb19kK
puC6Zzw2rnA>. Acesso em: 21 fev. 2021.

5.2. Tecnologias Disruptivas em Eco-Inovação e Green Supply Chain


Com o surgimento das tecnologias disruptivas foi possível a união de três áreas: empreendedorismo,
inovação e sustentabilidade. Desta forma, como sugestão seria interessante uma pesquisa mediante um
estudo de caso para verificar como as tecnologias disruptivas estão afetando a eco-inovação de uma
determinada empresa, usando o referencial teórico do estudo de Hojnik e Ruzzier (2016), no qual os
autores concluíram que a ecoinovação de produto, ecoinovação de processo e ecoinovação organizacional
são impulsionados por economia de custos e tamanho da empresa. Há também a viabilidade de fazer
um levantamento por meio de questionário de forma a verificar quais são os impulsionadores que levam
à eco-inovação das empresas. Por outro lado, é interessante verificar em um TCC por meio de estudo de
caso se a utilização do Green Supply pode afetar a eficiência dos negócios de uma empresa agropecuária.
Esse estudo pode ter como base a pesquisa de Dallasega e Sarkis (2018), que analisou como o Green
Supply Chain pode trazer eficiência para o negócio. Assim, de acordo com os autores, as ineficiências
(desperdício e custos) podem ser eliminadas com o uso da abordagem de proximidade: proximidade
organizacional, geográfica, cognitiva e tecnológica. Por fim, um levantamento por meio de questionário
ou entrevistas com o objetivo de mapear como as tecnologias disruptivas estão sendo aplicadas em
Eco-Inovação e Green Supply Chain e verificar quais os ganhos que elas obtêm com a utilização destas
tecnologias disruptivas também seria um bom tema para elaboração de um TCC.

Referências
Aryal, A.; Liao, Y.; Nattuthurai, P.; Li, B. 2020. The emerging big data analytics and IoT in supply chain manage-
ment: a systematic review. Supply Chain Management: An International Journal, 25(2): 141–156. Disponível
em: <https://www.emerald.com/insight/content/doi/10.1108/SCM-03-2018-0149/full/html?casa_token=r9dYE-
FDXEGMAAAAA:hugld5sx69cebg1mocm962SZNQ3bXqnh665jwWucSxNfdU1j2Qk0seitRUo0YUA3ZfUT7sKCa-
gYuwhSCzFL0wYBIW4MckCqClZvOhp_DGjGV502G2bG11g>. Acesso em: 21 fev. 2021.

Colombo, L.A.; Pansera, M.; Owen, R. 2019. The discourse of eco-innovation in the European Union: An analysis
of the Eco-Innovation Action Plan and Horizon 2020. Journal of Cleaner Production, 214(1): 653-665. Disponível
em: <https://www.sciencedirect.com/science/article/pii/S0959652618338605?casa_token=JQfMFGKjSAoAAAA-
A:sPz0JuJlw_2JyAnPLwYLYEV-QRvVhPqvjZAvV8ztN4ZcVXjPfdz4U-6yAvFpGLYd332mc3MfbVsH>. Acesso em: 21
fev. 2021.

Dallasega, P.; Sarkis, J. 2018. Understanding greening supply chains: Proximity analysis can help. Resources,
Conservation and Recycling, 139(1): 76-77. Disponível em: <https://www.sciencedirect.com/science/article/pii/
S0921344918302854?casa_token=fF9zb-4KIlwAAAAA:UtgDSH2V217yKLyXbLKe-mKQg1G33oRixyYGrwJ5N-
Q1e_YJBXct0-nOy-_4u_go5Vs1UbBuw-lk6>. Acesso em: 21 fev. 2021.

Hazarika, N.; Zhang, X. 2019. Evolving theories of eco-innovation: A systematic review. Sustainable
Production and Consumption, 19: 64-78. Disponível em: <https://www.sciencedirect.com/science/article/pii/
S2352550918303592?casa_token=_vkGRdsmexsAAAAA:MXqTWDxl1On_HzjWoA6JuuNbCNXyAyy4XVspY-
kBGf8iw6pHPxdr0gftfQngXAn_TUMLYo0o87-h>. Acesso em: 21 fev. 2021.

Hojnik, J.; Ruzzier, M. 2016. What drives eco-innovation? A review of an emerging literature. Environmental
Innovation and Societal Transitions, 19(1): 31-41. Disponível em: <https://www.sciencedirect.com/science/

44
TCC em Data Science e Analytics: áreas e linhas de pesquisa

article/pii/S2210422415300216?casa_token=17qQrQGQqEIAAAAA:-ofC3NIFDwA2rLSw7qRposJt5nH-
6ge_FLA0vI0TeRVKwfKlE567JpRPzEAwljyZ4T9byk6NVtKh1>. Acesso em: 21 fev. 2021.

Lima, M.M.; Miranda, M.G.; Dusek, P.M.; Avelar, K.E.S. 2019. A quarta revolução industrial sob o tripé da
sustentabilidade. Semioses, 13(3): 76-86. Disponível em: < https://revistas.unisuam.edu.br/index.php/
semioses/article/view/392>. Acesso em: 21 fev. 2021.

5.3. Realidade Virtual e Aumentada


A Realidade Virtual e Aumentada estão cada vez mais transformando os negócios. Especialmente,
porque elas permitem aos usuários experiências virtuais, mais reais. Através de um estudo de caso
seria interessante investigar como uma determinada empresa de tecnologia utiliza Realidade Virtual e
Aumentada de forma a impulsionar as vendas de seus produtos. Além disso, o aluno pode desenvolver,
no TCC, um aplicativo que auxilie as empresas de prestação de serviço a treinar os seus funcionários por
meio da Realidade Virtual e Aumentada, tendo como referência a pesquisa de Nazir et al. (2012), que
estudou como a realidade virtual e realidade aumentada podem ser utilizadas como ferramentas para
treinar operadores industriais. Os autores concluíram que o resultado positivo destas ferramentas de
treinamento de operadores consiste em aumentar a confiabilidade, o custo-benefício, o respeito ao meio
ambiente e a segurança do processo. Outra sugestão de TCC seria o desenvolvimento de um aplicativo
com base na Realidade Virtual e Aumentada que pode auxiliar as empresas do mercado imobiliário
a interagir com seus potenciais clientes. Estudo semelhante foi realizado por Ludvig e Araújo (2012),
que apurou como essas ferramentas podem ser empregadas no mercado imobiliário e concluiu que as
aplicações de realidade aumentada usam um marcador para posicionar e orientar os elementos virtuais
no mundo real, e se configura em um meio de interação do usuário com a aplicação. Como última
sugestão, o aluno tem a possibilidade de verificar no seu TCC, por meio de aplicação de questionário, se
as empresas estão utilizando a realidade virtual e aumentada em seus negócios ou quais as barreiras
para utilização dessa tecnologia inovadora.

Referências
Farshid, M.; Paschen, J.; Eriksson, T.; Kietzmann, J. 2018. Go boldly!: Explore augmented reality
(AR), virtual reality (VR), and mixed reality (MR) for business. Business Horizons, 61(5): 657-663.
Disponível em: <https://www.sciencedirect.com/science/article/pii/S000768131830079X?casa_
token=lrz_RAcJ5BgAAAAA:QSa2vG1IAUco28j5agi-196g0dbUqiVSU9a7sfU7N81QD0V-
nmijid5BSC1zN0KzC1HEWC4VwCzb>. Acesso em: 21 fev. 2021.

Ludvig, G.; Araújo, D. 2012. Realidade aumentada: tecnologia para o mercado imobiliário em um mundo
virtual e real. Cadernos UniFOA, 7(1): 349. Disponível em: <http://revistas.unifoa.edu.br/index.php/cadernos/
article/view/2167>. Acesso em: 21 fev. 2021.

Matos Silva, J.V.; Rodello, I.A. 2017. Fatores Determinantes Para a Elaboração De Estratégias Com Vistas À
Aceitação E Uso Da Realidade Aumentada Em Cenários De Negócio. Universitas: Gestão e TI, 7(1): 117-125.
Disponível em: <https://www.jus.uniceub.br/gti/article/view/4131>. Acesso em: 21 fev. 2021.

Monteiro, J.H.F.; Montanha, G.K. 2019. Desenvolvimento de aplicação em realidade virtual. Tekhne e
Logos, 10(2): 99-111. Disponível em: <http://revista.fatecbt.edu.br/index.php/tl/article/view/607>. Acesso em:
21 fev. 2021.

Nazir, S.; Totaro, R.; Brambilla, S.; Colombo, S.; Manca, D. 2012. Virtual reality and augmented-virtual reality as
tools to train industrial operators. Computer Aided Chemical Engineering, 30(1): 1397-1401. Disponível em:
<https://www.sciencedirect.com/science/article/pii/B978044459520150138X?casa_token=EzME1nsoEH8AAAA-
A:jCZHdzzGqr2fRAMBbmpauDW9701jipfh5IcAHznX8gXFDOjHG784BAYVi04rkn7zhMXitKFUfpLB>. Acesso em:
21 fev. 2021.

Silva, D.; Costa, J.; Ingracio, P.; Oliveira, W. 2011. Realidade virtual aumentada aplicada como ferramenta de
apoio ao ensino. Tecnologias em Projeção, 2(1): 11-15. Disponível em: <http://revista.faculdadeprojecao.edu.
br/index.php/Projecao4/article/view/75>. Acesso em: 21 fev. 2021.

45
R. B. dos Santos e F. Vasconcelos

5.4. Startups
Startup é um modelo ágil de negócio que tem crescido de maneira exponencial nos últimos
anos. Um dos motivos deste fenômeno é o seu crescimento acelerado e suas soluções inovadoras.
Desta forma, um TCC pode desenvolver um estudo de caso com uma startup para verificar como foi
o processo de implementação da cultura, do modelo ágil de fazer negócios e constatar se a empresa
enfrentou resistência por parte dos funcionários com relação a adoção de tecnologias disruptivas.
Outra possibilidade de pesquisa para elaboração de um TCC é investigar se empresas tradicionais estão
implementando a tecnologia e forma de trabalhar ágil das startups em seus negócios. Assim, seria
interessante realizar um levantamento por meio de questionário ou entrevistas para mapear o perfil
das empresas tradicionais que estão inovando ao utilizar esta tecnologia disruptiva para fazer frente às
startups inovadoras. Outro estudo interessante para um TCC seria um estudo de caso com uma startup
para verificar quais as estratégias de inovação elas têm utilizado em seus negócios.

Referências
Paiva, D.F.; Azevedo, M.D.C.; Araújo, F.N. 2019. Startups como modelo de empreendedorismo propulsor
à abertura exitosa de novas empresas. Negócios em projeção, 10(1): 87-100. Disponível em: <http://
revista.faculdadeprojecao.edu.br/index.php/Projecao1/article/view/1278>. Acesso em: 21 fev. 2021.

Rocha, R.O.; Olave, M.E.L.; Ordonez, E.D.M. 2019. Estratégias de inovação para Startups. Revista
Pretexto, 20(2): 87-99. Disponível em: <http://revista.fumec.br/index.php/pretexto/article/view/5996>.
Acesso em: 21 fev. 2021.

Rompho, N. 2018. Operational performance measures for startups. Measuring Business Excellence,
22(1): 31-41. Disponível em: <https://www.emerald.com/insight/content/doi/10.1108/MBE-06-2017-
0028/full/html?casa_token=nefXpxOHHKAAAAAA:r4YEHvE6Ch8C-cLH2ApVekHcZqdK8mBPHKEfSf9JO
EbEl2D0wHlHTfJFFoB-VjM-DqrLVvEHOWPMS1t_DbMTl21pBwKOM7IltPHwylqBUNqFDNrsoHkmFQ>.
Acesso em: 21 fev. 2021.

Spender, J.C.; Corvello, V.; Grimaldi, M.; Rippa, P. 2017. Startups and open innovation: a review of the
literature. European Journal of Innovation Management, 20(1) 4-30. Disponível em: <https://www.
emerald.com/insight/content/doi/10.1108/EJIM-12-2015-0131/full/html?casa_token=ZIQx03NidFwAAAA
A:1eXnfSZGRkjWgnzRx2MT4R7kAS5xzxDZG1GwOUyCQw-UcvlD6-_Vq3RdHKezXjAOC8ETaHVeVe8aZ17D
8JV5pcTZ00ZTwDPhxWWD-Ga8LZJb0WiXRbO9pw>. Acesso em: 21 fev. 2021.

Stocker, F.; Silva, N.M.D.S.; Souza, J.C.D.J.; Silva, T.M.; de Almeida Santos, F.; Sergio, R.D.
2019. Desenvolvimento e Investimento de Startups brasileiras: a percepção de múltiplos
stakeholders. Brazilian Applied Science Review, 3(6): 2626-2642. Disponível em: <https://www.
brazilianjournals.com/index.php/BASR/article/view/5253>. Acesso em: 21 fev. 2021.

5.5. Fintechs
As “Fintechs”, em sua maioria, são startups que trabalham para inovar e otimizar serviços do
sistema financeiro. Assim, essas empresas possuem custos operacionais muito menores comparadas
às instituições tradicionais do setor. Desta forma, em seu TCC há possibilidade de realizar um estudo de
caso com uma fintech de forma a analisar quais as oportunidades e os desafios para elas entrarem e se
manterem no mercado, tendo como referencial teórico a pesquisa de Lee e Shin (2018), que ilustrou o
uso de opções reais para decisões de investimento em fintech, e os desafios técnicos e gerenciais para
startups de fintech e instituições financeiras tradicionais. Outra possibilidade de pesquisa é verificar,
por meio de aplicação de questionário, entrevistas ou estudo de caso e a percepção das pessoas com
relação aos serviços prestados pelas fintechs, por exemplo, Nubank, considerando que algumas pessoas
ainda não se sentem seguram em abandonar os serviços financeiros tradicionais pelos de uma fintech.
Pesquisa semelhante foi realizada por Mascarenhas et al. (2021), quando foi analisada a influência
da percepção de riscos e benefícios para continuidade de uso de serviços das fintechs. Os autores
apresentam as características demográficas e comportamentais do cliente brasileiro dessa modalidade
de empresa, abrindo espaço para compreensão do mercado e melhoria nos serviços.

46
TCC em Data Science e Analytics: áreas e linhas de pesquisa

Referências
Berg, T.; Burg, V.; Gombović, A.; Puri, M. 2020. On the rise of fintechs: Credit scoring using digital
footprints. The Review of Financial Studies, 33(7): 2845-2897. Disponível em: <https://academic.oup.com/rfs/
article/33/7/2845/5568311?login=true>. Acesso em: 21 fev. 2021.

Boot, A.; Hoffmann, P.; Laeven, L.; Ratnovski, L. 2021. Fintech: what’s old, what’s new? Journal of
Financial Stability, 53(1): 1-13. Disponível em: <https://www.sciencedirect.com/science/article/pii/
S157230892030139X?casa_token=tBFeWongy1YAAAAA:iI9J9WU11Zr-9TOJEhzMmn63-UI10Zdnc1fXuN2h0nMZ
dq3t11MXp1TTVudrwSsthxPz3NF3R1ES>. Acesso em: 21 fev. 2021.

Laidroo, L.; Koroleva, E.; Kliber, A.; Rupeika-Apoga, R.; Grigaliuniene, Z. 2021. Business models of
FinTechs–Difference in similarity? Electronic Commerce Research and Applications, 46(1): 1-14.
Disponível em: <https://www.sciencedirect.com/science/article/pii/S1567422321000065?casa_
token=eRsDYaxl0DcAAAAA:vXB03Qle3Cn__vje8kCr-MB7nunoOfoe9Xe7faJlxK_Nk9G0Pp_
TnZwzdorg6t1QjjfQqGSrc7vD>. Acesso em: 21 fev. 2021.

Lee, I.; Shin, Y.J. 2018. Fintech: Ecosystem, business models, investment decisions, and challenges. Business
Horizons, 61(1): 35-46. Disponível em: <https://www.sciencedirect.com/science/article/pii/
S0007681317301246?casa_token=dJzz1ySlDZ0AAAAA:7tA9EFW12hp5hVym3hSTe6zY0f1wIhOmarD3m1h_
WaWB3wa2Va-b-cVuJq82ZmDoL3frhNcXO6jm>. Acesso em: 21 fev. 2021.

Mascarenhas, A.B.; Perpétuo, C.K.; Barrote, E.B.; Perides, M.P. 2021. A Influência da Percepção de Riscos
e Benefícios para Continuidade de Uso de Serviços Fintechs. BBR. Brazilian Business Review, 18(1):
1-21. Disponível em: <https://www.scielo.br/scielo.php?pid=S1808-23862021000100001&script=sci_
arttext&tlng=pt>. Acesso em: 21 fev. 2021.

Milian, E.Z.; Spinola, M.D.M.; Carvalho, M.M. 2019. Fintechs: A literature review and research agenda. Electronic
Commerce Research and Applications, 34(1): 1-21. Disponível em: <https://www.sciencedirect.com/science/
article/pii/S1567422319300109?casa_token=swJ6z9qpT6oAAAAA:1LWKRIYs6w5YACTSDlTs4uEZxFRf8Vvga9l2ly
YknPHo13uS24SCMnV4yeH1Xyc261xMaWo-K-9g>. Acesso em: 21 fev. 2021.

5.6. Smart Cities


“Smart Cities” ou Cidades Inteligentes é um modelo de cidade que usa tipos diferentes de sensores
eletrônicos para coletar dados e usá-los para gerenciar recursos e ativos eficientemente. Assim, elas
abrem diversas oportunidades para os pequenos negócios, em áreas como saúde, educação, mobilidade,
meio ambiente, energia e turismo. Assim, é possível a elaboração de um estudo de caso para verificar
como uma Smart City utiliza Big Data de forma a obter uma cidade mais sustentável, tal como realizado
por Nuaimi et al. (2015) na sua pesquisa que verificou quais as aplicações de Big Data para Smart Cities.
De acordo com os autores, os resultados mostram que há várias oportunidades para a utilização de Big
Data em cidades inteligentes. Porém, ainda existem muitos problemas e desafios a serem enfrentados
para alcançar melhor utilização desta tecnologia. Desta forma, é interessante realizar um levantamento
por meio de questionário para verificar quais os desafios que as cidades inteligentes enfrentam para
utilizar Big Data na tomada de decisão. Por outro lado, também é viável realizar um estudo de caso com
uma empresa que utiliza Big Data para diminuir a emissão de carbono, seguindo o referencial teórico do
estudo de Giest (2017) que investigou como o uso de Big Data pode ser utilizado para mitigar as emissões
de carbono em cidades inteligentes. A autora concluí que a complexidade institucional subjacente à
integração de Big Data limita a capacidade de aplicação desta ferramenta em smart cities.

Referências
Fariniuk, T.M.D. 2020. Smart cities e pandemia: tecnologias digitais na gestão pública de cidades
brasileiras. Revista de Administração Pública, 54(4): 860-873. Disponível em: <https://www.scielo.br/
scielo.php?pid=S0034-76122020000400860&script=sci_arttext>. Acesso em: 21 fev. 2021.

Giest, S. 2017. Big data analytics for mitigating carbon emissions in smart cities: opportunities and
challenges. European Planning Studies, 25(6): 941-957. Disponível em: <https://www.tandfonline.com/
doi/full/10.1080/09654313.2017.1294149>. Acesso em: 21 fev. 2021.

47
R. B. dos Santos e F. Vasconcelos

Meotti, A.F.; Souza Silva, A. 2016. Formas criativas de mobilidade urbana. Revista Nacional de
Gerenciamento de Cidades, 4(26): 136-146. Disponível em: <https://amigosdanatureza.org.br/
publicacoes/index.php/gerenciamento_de_cidades/article/view/1349>. Acesso em: 21 fev. 2021.

Nuaimi, E.A.; Al Neyadi, H.; Mohamed, N.; Al-Jaroodi, J. 2015. Applications of big data to smart
cities. Journal of Internet Services and Applications, 6(1): 1-15. Disponível em: <https://jisajournal.
springeropen.com/articles/10.1186/s13174-015-0041-5>. Acesso em: 21 fev. 2021.

Talari, S.; Shafie-Khah, M.; Siano, P.; Loia, V.; Tommasetti, A.; Catalão, J.P. 2017. A review of smart cities
based on the internet of things concept. Energies, 10(4): 1-23. Disponível em: <https://www.mdpi.
com/1996-1073/10/4/421>. Acesso em: 21 fev. 2021.

Trindade, E.P.; Hinnig, M.P.F.; Costa, E.M.; Marques, J.S.; Bastos, R.C.; Yigitcanlar, T. 2017. Sustainable
development of smart cities: A systematic review of the literature. Journal of Open Innovation:
Technology, Market, and Complexity, 3(3): 1-14. Disponível em: <https://www.mdpi.com/2199-
8531/3/3/11>. Acesso em: 21 fev. 2021.

5.7. Ecossistemas
Os ecossistemas de negócios referem-se à inovação nos modelos de gerenciamento empresarial.
O conceito de ecossistemas empresariais consiste em pensar em um negócio não apenas como parte
de uma única, mas como parte de um ecossistema de negócios no qual diversas empresas fazem parte.
Um estudo de caso pode ser elaborado no TCC com a finalidade de verificar como determinada empresa
percebe sua participação em um ecossistema de negócio e como afeta sua tomada de decisão sua inserção
nesse contexto. Sobre o tema pode-se tomar como referência o estudo de Clarysse et al. (2014) que
analisou como se dá a criação de valor em ecossistemas. Os autores constataram que o ecossistema de
conhecimento está bem estruturado e concentrado em torno de uma série de atores centrais, enquanto
o ecossistema de negócios é quase inexistente no nível local. No mesmo sentido, o aluno pode realizar
um levantamento por meio de questionário ou entrevistas de forma a investigar como as inovações
afetam as empresas que estão em determinado ecossistema, tendo por base a pesquisa de Kon (2016)
que examinou as características dos ecossistemas de inovação focando o papel das inovações nas
atividades de serviços envolvidas. Nos ecossistemas também estão as plataformas digitais, razão pela
qual cabe a investigação do papel dessas tecnologias no ecossistema que está inserido. O pesquisador
pode tomar como referência o estudo de Gomes e Okano (2019), no qual verificaram como os usuários
das plataformas digitais percebem o valor neste novo cenário tecnológico. Os autores encontraram que
a metade dos usuários mantêm os serviços básicos como Facebook e WhatsApp.

Referências
Clarysse, B.; Wright, M.; Bruneel, J.; Mahajan, A. 2014. Creating value in ecosystems: Crossing the
chasm between knowledge and business ecosystems. Research policy, 43(7): 1164-1176. Disponível
em: <https://www.sciencedirect.com/science/article/pii/S0048733314000766?casa_token=DXt6s-
Z9FuWoAAAAA:hME9FsS8CAFRT8HrHioGOSi_ajmJjC2kzmXwtkATbKsyUHP_0X980H6Z06-8dHJFpA-
PBxeL0hvbo>. Acesso em: 21 fev. 2021.

D’Souza, A.; Wortmann, H.; Huitema, G.; Velthuijsen, H. 2015. A business model design framework
for viability, a business ecosystem approach. Journal of Business Models, 3(2): 1-29. Disponível em:
<https://130.225.53.24/index.php/JOBM/article/view/1216>. Acesso em: 21 fev. 2021.

Gomes, J.G.C.; Okano, M.T. 2019. Plataformas digitais como modelos de negócio: uma pesquisa
exploratória. South American Development Society Journal, 5(13): 232-254. Disponível em: <http://
www.sadsj.org/index.php/revista/article/view/215>. Acesso em: 21 fev. 2021.

Kon, A. 2016. Ecossistemas de inovação: a natureza da inovação em serviços. Revista de


Administração, Contabilidade e Economia da Fundace, 7(1): 14-27. Disponível em: <https://www.
fundace.org.br/revistaracef/index.php/racef/article/view/170>. Acesso em: 21 fev. 2021.

48
TCC em Data Science e Analytics: áreas e linhas de pesquisa

Li, J.; Chen, L.; Yi, J.; Mao, J.; Liao, J. 2019. Ecosystem-specific advantages in international digital
commerce. Journal of International Business Studies, 50(9): 1448-1463. Disponível em: <https://link.springer.
com/article/10.1057/s41267-019-00263-3>. Acesso em: 21 fev. 2021.

Zahra, S.A.; Nambisan, S. 2012. Entrepreneurship and strategic thinking in business ecosys-
tems. Business horizons, 55(3): 219-229. Disponível em: <https://www.sciencedirect.com/science/
article/pii/S0007681311001881?casa_token=yV1R6k9qCPwAAAAA:h5q9LRALHAiXYZsBbFIXfE7UQFf0P8c-
QUD8UUbu48SxUiNCX0z6v1Sgqn01BBiPHmKZPiOz4elRu>. Acesso em: 21 fev. 2021.

5.8. Plataformas de Negócios Digitais


As plataformas digitais são novos modelos de negócios que funcionam por meio de tecnologias.
Grandes empresas, tais como: Amazon, Google, Uber e Netflix, estão utilizando as plataformas digitais
para fazer negócios on-line. Assim, elas conseguem conectar serviços e pessoas de forma prática,
dinâmica e eficiente. Assim, um levantamento por meio de questionário com o objetivo de verificar com
as empresas têm utilizado as plataformas digitais para fazer negócios seria um tema interessante e
atual para realização de um TCC. Além disso, o aluno pode propor um modelo que compare a eficiência
dos diferentes modelos de negócios digitais, usando como referência o estudo de Brousseau e Penard
(2007), no qual propuseram uma estrutura analítica para comparar diferentes modelos de negócios
para a produção de bens de informação e serviços digitais. Os autores afirmam que os usuários
têm desempenhado um papel essencial na produção de informação e na competitividade entre os
fornecedores. Desta forma, em seu TCC seria relevante realizar múltiplo estudo de caso para verificar
quais os modelos de negócios digitais que as empresas estão utilizando no Brasil, bem como para
verificar a percepção das empresas com relação ao papel das inovações nos negócios digitais.

Referências
Brousseau, E.; Penard, T. 2007. The economics of digital business models: A framework for analyzing the
economics of platforms. Review of network Economics, 6(2): 81-114. Disponível em: <https://www.degruyter.
com/document/doi/10.2202/1446-9022.1112/html>. Acesso em: 21 fev. 2021.

Garcez, R.M.; Ferreira, E.M.S.; Silva, E.D.M.S.; Lima, C.A.C. 2020. A Era da Inovação e Modelos de Negócios
Digitais no Capitalismo Contemporâneo: O Fenômeno Inovativo da Uberização. Brazilian Journal of
Development, 6(11): 88408-88417. Disponível em: <https://www.brazilianjournals.com/index.php/BRJD/article/
view/19912>. Acesso em: 21 fev. 2021.

Gomes, J.G.C.; Okano, M.T. 2019. Plataformas digitais como modelos de negócio: uma pesquisa
exploratória. South American Development Society Journal, 5(13): 232-254. Disponível em: <http://www.sadsj.
org/index.php/revista/article/view/215>. Acesso em: 21 fev. 2021.

Markus, M.L.; Loebbecke, C. 2013. Commoditized digital processes and business community platforms: New
opportunities and challenges for digital business strategies. Mis Quarterly, 37(2): 649-653. Disponível em:
<https://www.jstor.org/stable/43825930?casa_token=8JrQ-d95_MwAAAAA%3ACuF3nsLuyNbY1xku9_KdjlLm-
cGzIIYXTgDPv_ze4TrtxVpP2_IegBEgTe1UOWyeewWztYkWqmdvbaHkoD_MQpj_fwFH10n63yvBbf3eRXAY9Lz3Q-
gRbQ&seq=1#metadata_info_tab_contents>. Acesso em: 21 fev. 2021.

Pereira, J.A.; Bernardo, A. 2016. Empreendedorismo Digital: estudo do Projeto Negócios Digitais desenvolvido
pelo SEBRAE-PR em Maringá. Desenvolvimento em Questão, 14(37): 293-327. Disponível em: <https://revistas.
unijui.edu.br/index.php/desenvolvimentoemquestao/article/view/4422>. Acesso em: 21 fev. 2021.

Rodrigues, F.; Capoano, E. 2018. Gestão de Negócios de Mídia: um meta estudo sobre decisões
estratégicas. Revista FAMECOS, 25(3): 1-23. Disponível em: <https://revistaseletronicas.pucrs.br/index.php/
revistafamecos/article/view/29188>. Acesso em: 21 fev. 2021.

6. Analytics para Modelos de Risco e Gestão em Projetos de Data Science


O Analytics é a análise computacional sistemática de dados. Essa ferramenta de Data Science
pode ser aplicada para resolver diversos problemas corporativos, tais como: risco operacional, falta
de compliance em projetos, risco de crédito, legal e regulamentar, social e ambiental, reputacional e

49
R. B. dos Santos e F. Vasconcelos

cibernético. Além disso, as ferramentas de Analytics têm ampla utilização na gestão de investimento
e valuation de empresas. A seguir, serão apresentadas algumas ideias de pesquisas que podem ser
consideradas para desenvolver seu TCC na temática de Analytics para modelos de risco e gestão em
projetos de Data Science.

6.1. Modelos de Gestão de Risco Operacional


Os Modelos de Gestão do Risco operacional adotado têm por objetivo identificar, mensurar, avaliar,
monitorar, reportar, controlar e mitigar as exposições ao risco operacional de produtos, processos e
serviços. Assim, seria viável propor um modelo com base em Analytics para a gestão de risco operacional
em bancos e seguradoras, tomando por base a pesquisa realizada por Alves e Matias (2014) em que foi
avaliado o estágio de desenvolvimento das atividades relacionadas à gestão de risco operacional e outras
questões relevantes para os bancos portugueses. Seria possível também realizar um estudo de caso
com uma empresa do setor de construção civil com finalidade de mapear os principais fatores de risco
desta empresa, mediante a metodologia de Analytics. O pesquisador pode ter como referência o estudo
realizado por Albani et al. (2016), no qual eles determinaram as métricas e realizaram um mapeamento
dos riscos para a análise de cadeias de suprimentos enxutas. Outro tema de estudos para um TCC seria
aplicar um questionário para verificar se as empresas utilizam modelos de gestão de risco operacional
em seus negócios com utilização de ferramentas de Analytics e quais seus benefícios e limitações. Neste
sentido, haveria a possibilidade de propor um modelo de gestão de risco que ajudem as empresas a lidar
com problemas de fraudes, falhas de sistemas, de execução, de produtos ou serviços. Para desenvolver
esse modelo, uma pesquisa relevante foi realizada por Magro e Cunha (2017) para verificar a relevância
que os auditores internos de cooperativas de crédito atribuem aos “red flags” na avaliação do risco de
ocorrência de fraudes.

Referências
Albani, H.; Antunes, C.; Senna, P.; Souza, L.A.; Monteiro, A. 2016. Determinação de métricas e mapeamento de
riscos para a análise de cadeias de suprimentos enxutas. Journal of Lean Systems, 1(1): 31-50. Disponível em:
<http://www.nexos.ufsc.br/index.php/lean/article/view/1102>. Acesso em: 21 fev. 2021.

Alves, M.T.; Matias, F.J.F. 2014. Gestão e divulgação do risco operacional e os acordos de Basileia: o caso dos
maiores bancos portugueses. Revista Universo Contábil, 10(3): 172-193. Disponível em: <https://bu.furb.br/ojs/
index.php/universocontabil/article/view/4080>. Acesso em: 21 fev. 2021.

Magro, C.B.D.; Cunha, P.R.D. 2017. Red flags na detecção de fraudes em cooperativas de crédito:
percepção dos auditores internos. Revista Brasileira de Gestão de Negócios, 19(65): 469-491.
Disponível em: <https://www.scielo.br/scielo.php?pid=S1806-48922017000300469&script=sci_
arttext&tlng=pt>. Acesso em: 21 fev. 2021.

Shahbaz, M.S.; Kazi, A.G.; Othman, B.; Javaid, M.; Hussain, K.; Rasi, R.Z.R.M. 2019. Identification, assessment and
mitigation of environment side risks for Malaysian manufacturing. Engineering, Technology & Applied Science
Research, 9(1): 3851-3857. Disponível em: <https://www.etasr.com/index.php/ETASR/article/view/2529>.
Acesso em: 21 fev. 2021.

Silva, M.R.C.; Monteiro, A.D.O. 2019. Restruturação da governança corporativa e de compliance em uma
situação de crise: o caso da Odebrecht S.A. Gestão & Planejamento - G&P, 20(1): 420-436. Disponível em:
<https://revistas.unifacs.br/index.php/rgb/article/view/5652>. Acesso em: 21 fev. 2021.

Souza, M.I.C.P. 2020. Uma perspectiva da implementação do Compliance nas empresas do Brasileiras. Revista
Científica BSSP, 1(1): 1-17. Disponível em: <https://revistacientificabssp.com.br/journal/rcbssp/
article/5f6274570e8825ed23c2702f>. Acesso em: 21 fev. 2021.

6.2. Compliance em Projetos de Data Science e Analytics


Cada vez mais, as organizações estão se preocupando mais com a questão do Compliance,
especialmente, porque é algo que a sociedade tem demandado, tanto em instituições privadas como
públicas. Assim, seria viável realizar um levantamento por meio de questionário/entrevistas para verificar

50
TCC em Data Science e Analytics: áreas e linhas de pesquisa

se as instituições têm uma política de Compliance para projetos de Data Science e Analytics, bem como
mapear quais são as principais práticas aplicadas pelas empresas. Além disso, haveria a possibilidade
de realizar um estudo de caso de forma a verificar se uma determinada empresa adota procedimentos
de controle internos em sua atividade, com o objetivo de alinhar a cultura corporativa e as práticas de
Compliance. Neste sentido, a técnica “clustering” ou análise fatorial seria uma forma interessante de
verificar se uma determinada empresa de consultoria estabelece controles internos para aumentar a
eficácia de seus processos. Pode-se tomar como referência o estudo realizado por Länsiluoto et al. (2016)
que examinaram e visualizaram a estrutura de controle interno adotada pelas empresas e sua eficácia
utilizando uma abordagem de “clustering”.

Referências
Azevedo, M.M.; Cardoso, A.A.; Federico, B.E.; Lima, M.A.F.; Duarte, J.G. 2017. O compliance e a gestão de riscos
nos processos organizacionais. Revista de Pós-Graduação Multidisciplinar, 1(1): 179-196. Disponível em:
<http://www.fics.edu.br/index.php/rpgm/article/view/507>. Acesso em: 21 fev. 2021.

Cortez, I.S.; Kubota, L.C. 2013. Contramedidas em segurança da informação e vulnerabilidade cibernética:
evidência empírica de empresas brasileiras. Revista de Administração, 48(4): 757-769. Disponível em: <https://
www.sciencedirect.com/science/article/pii/S0080210716303065>. Acesso em: 21 fev. 2021.

Länsiluoto, A.; Jokipii, A.; Eklund, T. 2016. Internal control effectiveness a clustering
approach. Managerial Auditing Journal, 31(1): 5-34. Disponível em: <https://www.emerald.
com/insight/content/doi/10.1108/MAJ-08-2013-0910/full/html?casa_token=oaUk8DPC_
PkAAAAA:Xyk9_skmlSwAie99pPXBdQosdNA0Psl3S5rc9cwZn_CZD_UNsP4QoZerFaCLq0W7z4iM77_
mcIDCLgdCnH5NQIQs7VfXKdKbD-gOy9xxGkafsDFxgyk>. Acesso em: 21 fev. 2021.

Saad, N. 2014. Tax knowledge, tax complexity and tax compliance: Taxpayers’ view. Procedia-Social and
Behavioral Sciences, 109(1): 1069-1075. Disponível em: <https://www.sciencedirect.com/science/article/pii/
S1877042813052294>. Acesso em: 21 fev. 2021.

Scandizzo, S. 2005. Risk mapping and key risk indicators in operational risk management. Economic
Notes, 34(2): 231-256. Disponível em: <https://onlinelibrary.wiley.com/doi/abs/10.1111/j.0391-
5026.2005.00150.x?casa_token=MT6qTRzjqrkAAAAA:zBRra4Kz_rwo3GFVie1MbGFqdheOP_
JjDQ1YzGnl7AUXmuKLDueAkzo2Oaoe6d8IRyPOgSq9nObq318>. Acesso em: 21 fev. 2021.

Wu, D.D.; Chen, S.H.; Olson, D.L. 2014. Business intelligence in risk management: Some recent
progresses. Information Sciences, 256(1): 1-7. Disponível em: <https://www.sciencedirect.com/science/article/
pii/S0020025513007238?casa_token=AAtNILf7-CMAAAAA:mSxyB2AuygDvch-1sLVvS4SiwFiHckWxjxaX7Olb2utK
w80oaWXiOchTgKNNepCpRpZkkjHT-w>. Acesso em: 21 fev. 2021.

6.3. Modelos de Risco de Crédito


As ferramentas de Analytics são úteis para propor modelos de Riscos de Crédito. Esses modelos
buscam prever a probabilidade que um cliente tem em ser inadimplente ou não, para auxiliar
especialmente as instituições financeiras e empresas comerciais na tomada de decisão. Os Modelos de
Risco de Crédito podem ser aplicados tanto para risco de crédito de empresas quanto de pessoa física.
Propor um modelo de crédito para uma empresa do comércio de forma que ela consiga prever se um
determinado cliente tem alta probabilidade ou não de ser inadimplente é um tema interessante e de
alta relevância para um TCC. O aluno pode tomar como base a pesquisa realizada por Gonçalves et al.
(2013), na qual os autores aplicaram a técnica de regressão logística para o desenvolvimento de um
modelo de predição de “credit scoring” com dados de uma instituição financeira. Também é possível
utilizar os dados do Serasa para propor um modelo de “credit scoring” para prever inadimplência das
empresas ou para estimar o risco de “default” de entes estatais, como prefeituras e empresas públicas.
Yap et al. (2011) aplicaram “Data Mining” para melhorar a avaliação da capacidade de crédito por meio de
modelos de “score” de crédito. Outra aplicação dos modelos de risco de crédito é o cadastro positivo que
trouxe implicações para todos os atores envolvidos no mercado de crédito. Assim, no TCC o pesquisador

51
R. B. dos Santos e F. Vasconcelos

pode aplicar um questionário para mapear os efeitos do cadastro positivo nos negócios e analisar os
indicadores de rentabilidade da empresa antes e depois desta medida.

Referências
Camargos, M.A.; Araújo, E.A.T.; Camargos, M.C.S. 2012. A inadimplência em um programa de crédito
de uma instituição financeira pública de minas gerais: uma análise utilizando regressão logística. REGE
- Revista de Gestão, 19(3): 473-492. Disponível em: <https://www.sciencedirect.com/science/article/pii/
S1809227616303204>. Acesso em: 21 fev. 2021.

Francisco, J.R.D.S.; Amaral, H.F.; Bertucci, L.A. 2013. Risco de Crédito em Cooperativas: Uma análise com base
no perfil do cooperado. Sociedade, Contabilidade e Gestão, 7(2): 137-149. Disponível em: <http://www.atena.
org.br/revista/ojs-2.2.3-06/index.php/ufrj/article/viewArticle/1499>. Acesso em: 21 fev. 2021.

Gonçalves, E.B.; Gouvêa, M.A.; Mantovani, D.M.N. 2013. Análise de risco de crédito com o uso de regressão
logística. Revista Contemporânea de Contabilidade, 10(20): 139-160. Disponível em: <https://periodicos.ufsc.br/
index.php/contabilidade/article/view/2175-8069.2013v10n20p139>. Acesso em: 21 fev. 2021.

Prado, J.W.; Carvalho, F.M.; Benedicto, G.C.; Alcântara, V.C.; Santos, A.C. 2018. Uma abordagem para análise do
risco de crédito utilizando o modelo Fleuriet. Revista de Educação e Pesquisa em Contabilidade (REPeC), 12(3):
341-363. Disponível em: <http://www.repec.org.br/repec/article/view/1816>. Acesso em: 21 fev. 2021.

Wang, G.; Ma, J.; Huang, L.; Xu, K. 2012. Two credit scoring models based on dual strategy ensemble
trees. Knowledge-Based Systems, 26(1): 61-68. Disponível em: <https://www.sciencedirect.com/science/article/
pii/S0950705111001353?casa_token=2-ze_lQfT8MAAAAA:KgSwWwiOkjFiXcgEa0N2sW9CktCzzpbH4LPFu9Iu
Rp-GUSRD5qWriIdB8H1Zk1a1IZ-J6kDogQ>. Acesso em: 21 fev. 2021.

Yap, B.W.; Ong, S.H.; Husain, N.H.M. 2011. Using data mining to improve assessment of credit worthiness via
credit scoring models. Expert Systems with Applications, 38(10): 13274-13283. Disponível em: <https://www.
sciencedirect.com/science/article/pii/S0957417411006749?casa_token=sycZXm8aCOcAAAAA:9HrPZDU3Z-Npn
nf2ejWJTEVnnVLJ8k6Qj0Cz2vAKPzj1fYuCy3bn9KJma-j06uA6uin9wXEujQ>. Acesso em: 21 fev. 2021.

6.4. Modelos de Risco Legal e Regulamentar


Uma área de pesquisa emergente é a que aplica modelos de Risco Legal e Regulamentar. O Risco
Legal acontece quando a empresa não está em conformidade com as normas da área de atuação
do seu negócio. Há vários contextos em que os modelos de Risco Legal e Regulamentar podem ser
aplicados. Por exemplo, seria possível propor um modelo de risco legal para prever riscos de perdas
em decorrência de alterações, impropriedades ou inexistência de normas para controles internos
e externos. No mesmo sentido propor um modelo de risco regulamentar para prever riscos de
segurança da informação em empresas que realizam negócios no ambiente de e-commerce seria um
tema interessante para um TCC. Como referência teórica poderia utilizar a pesquisa realizada por
Rocha et al. (2019) em que os autores analisaram como a ISO 27.001 pode ser usada como ferramenta
de controle para avaliar as implicações da nova lei brasileira sobre a proteção de dados, conhecida
como Lei Geral de Proteção de Dados Pessoais [LGPD]. Desta forma, em seu TCC o discente poderia
aplicar um questionário para verificar os impactos da LGPD nos negócios das empresas do setor de
tecnologia da informação. Com a expansão da utilização da Internet, cada vez mais as organizações
têm se preocupado com o direito digital, pois ele tem relação com o risco legal. Um dos riscos que as
organizações têm se preocupado é com o risco de imagem. Assim, seria possível realizar uma pesquisa
com os dados das empresas listadas na B3, para fins de verificar as práticas de responsabilidade
social corporativa e sua influência sobre a imagem das empresas. Temos como referência sobre essa
temática o estudo realizado por Azevedo et al. (2016), no qual os autores analisaram a relação entre
responsabilidade social e a imagem corporativa de uma empresa de marca global.

Referências
Azevedo, J.B.; Von Ende, M.; Wittmann, M.L. 2016. Responsabilidade social e a imagem corporativa: o caso
de uma empresa de marca global. Revista Eletrônica de Estratégia & Negócios, 9(1): 95-117. Disponível em:
<http://portaldeperiodicos.unisul.br/index.php/EeN/article/view/3142>. Acesso em: 21 fev. 2021.

52
TCC em Data Science e Analytics: áreas e linhas de pesquisa

Costa, R.R.S.; Pendiuk, F. 2018. Direito digital: o Marco Civil da Internet e as inovações jurídicas no
ciberespaço. FESPPR Pública, 2(1): 1-21. Disponível em: <http://publica.fesppr.br/index.php/publica/article/
view/129>. Acesso em: 21 fev. 2021.

Hekis, H.R.; Vasconcelos, C.R.P.; Paulino, R.D.; Martins, S.D. 2014. Imagem corporativa de instituições bancárias:
uma proposta de escala para sua mensuração. Revista Brasileira de Marketing, 13(5): 19-35. Disponível em:
<https://periodicos.uninove.br/remark/article/view/12053>. Acesso em: 21 fev. 2021.

Holt, M.; Lang, B.; Sutton, S.G. 2017. Potential employees’ ethical perceptions of active monitoring: The dark
side of data analytics. Journal of Information Systems, 31(2): 107-124. Disponível em: <https://meridian.
allenpress.com/jis/article-abstract/31/2/107/75861>. Acesso em: 21 fev. 2021.

Miranda, I.; Rocha, D.D.O.L. 2016. A possibilidade de Alocação de Riscos nos Contratos Administrativos Regidos
pela Lei n 8.666/93 à luz do Direito à Manutenção do Equilíbrio Econômico-Financeiro. Revista Científica
FAGOC - Jurídica, 1(1): 53-69. Disponível em: <https://revista.fagoc.br/index.php/juridico/article/view/74>.
Acesso em: 21 fev. 2021.

Rocha, C.P.; Carneiro, A.V.S.; Medeiros, M.V.B.; Melo, A. 2019. Segurança da Informação: A ISO 27.001 como
Ferramenta de Controle para LGPD. Revista de Tecnologia da Informação e Comunicação da Faculdade
Estácio do Pará, 2(3): 78-97. Disponível em: <http://www.revistasfap.com/ojs3/index.php/tic/article/view/285>.
Acesso em: 21 fev. 2021.

6.5. Modelos de Risco Social e Ambiental


Cada vez mais a sociedade tem exigido das empresas responsabilidade social. Assim, muitas
organizações têm utilizado as ferramentas de Analytics para modelar o risco social e ambiental. Desta
forma, pode-se utilizar os dados da B3 para propor um modelo de Risco Social e Ambiental para empresas
do setor energético de forma a verificar a relação entre a responsabilidade social e agregação de valor
ambiental, social e econômico, como na pesquisa realizada por Freguette et al. (2015) que analisaram a
relação entre a prática de Responsabilidade Social Corporativa e o Desempenho Financeiro de empresas
brasileiras. Da mesma forma, também é possível fazer um levantamento, por meio de questionário, com
o objetivo de verificar se as empresas consideram o risco social e ambiental na gestão de riscos. Outra
ideia de pesquisa seria verificar se o fato das empresas se engajarem em ações sociais, afeta a escolha
dos consumidores. Assim, a aplicação de um questionário para constatar se o engajamento em ações
sociais é algo que afeta a escolha de consumo seria um tema intrigante para elaboração de um TCC. Para
tal finalidade de pesquisa, poderia usar como referência o estudo realizado por Oliveira e Gouvêa (2010)
que constataram que a Responsabilidade Social Empresarial é importante nas decisões de compra dos
consumidores, para fins de adicionar novas perspectivas sobre o tema.

Referências
Baraibar-Diez, E.; Sotorrío, L.L. 2018. O efeito mediador da transparência na relação entre
responsabilidade social corporativa e reputação corporativa. Revista Brasileira de Gestão
de Negócios, 20(1): 5-21. Disponível em: <https://www.scielo.br/scielo.php?pid=S1806-
48922018000100005&script=sci_arttext>. Acesso em: 21 fev. 2021.

Freguete, L.M.; Nossa, V.; Funchal, B. 2015. Responsabilidade social corporativa e


desempenho financeiro das empresas brasileiras na crise de 2008. Revista de Administração
Contemporânea, 19(2): 232-248. Disponível em: <https://www.scielo.br/scielo.php?pid=S1415-
65552015000200232&script=sci_arttext>. Acesso em: 21 fev. 2021.

Menezes, E.M.J.; Silva, O.G. 2015. Diferentes percepções para a compreensão do conceito de risco no enfoque
ambiental. Revista da Casa da Geografia de Sobral (RCGS), 17(2): 12-22. Disponível em: <https://rcgs.uvanet.br/
index.php/RCGS/article/view/237>. Acesso em: 21 fev. 2021.

Oliveira, B.; Gouvêa, M.A. 2010. A importância das ações sociais empresariais nas decisões de compra
dos consumidores. Gestão & Produção, 17(4): 791-800. Disponível em: <https://www.scielo.br/scielo.
php?pid=S0104-530X2010000400012&script=sci_arttext&tlng=pt>. Acesso em: 21 fev. 2021.

53
R. B. dos Santos e F. Vasconcelos

Segal, R.L. 2018. Compliance ambiental na gestão empresarial: distinções e conexões entre Compliance
e auditoria de conformidade legal. REASU-Revista Eletrônica de Administração da Universidade Santa
Úrsula, 3(1): 1-22. Disponível em: <http://revistas.icesp.br/index.php/REASU/article/view/389>. Acesso
em: 21 fev. 2021.

6.6. Modelos de Risco Reputacional


Um dos principais ativos de uma empresa é sua reputação. Por isso, as empresas utilizam Modelos
de Risco de Reputação, pois, muitas vezes, o risco reputacional é maior do que o risco financeiro. Assim, é
essencial que se considere esse tipo de risco no modelo do negócio. Os Modelos de Risco Reputacional podem
ser aplicados para resolver alguns problemas e isso pode ser explorado pelo aluno para propor um modelo
de risco reputacional com o objetivo de analisar as variáveis que geram danos de imagem e de reputação.
Um estudo de caso para verificar quais ferramentas que uma empresa, que se envolveu em escândalos ou
eventos que causaram danos à sua imagem, utilizou para lidar com isso poderia ser um bom tema para
um TCC, tendo por base o estudo realizado por Oliveira e Franco (2018), no qual os autores identificaram e
analisaram as ferramentas de comunicação social utilizadas pela Samarco para minimizar o impacto negativo
causado pelo rompimento de barragens administradas pela instituição. Neste sentido, o TCC pode investigar
os processos que anteveem danos reputacionais em empresas que passaram por este tipo de crise, e propor
um modelo ou framework, usando como referencial teórico a pesquisa realizada por Cardoso (2020), na qual
o autor analisou e avaliou as vantagens econômicas e a diminuição dos custos de transação na aplicação de
políticas de “compliance” nas pessoas jurídicas de direito privado.

Referências
Ávila, M.D.G. 2014. Gestão de riscos no setor público. Revista Controle-Doutrina E Artigos, 12(2): 179-198.
Disponível em: <https://revistacontrole.tce.ce.gov.br/index.php/RCDA/article/view/110>. Acesso em: 21 fev. 2021.

Blikstein, I.; Fernandes, M.; Coutinho, M. 2018. Fake news no mundo corporativo. GV Executivo, 17(5):
22-25. Disponível em: <http://bibliotecadigital.fgv.br/ojs/index.php/gvexecutivo/article/view/77337>. Acesso
em: 21 fev. 2021.

Cardoso, M.F.P. 2020. As vantagens econômicas e a minimização dos custos de responsabilidade e de


transação na implantação de políticas de compliance nas empresas. Revista ESMAT, 12(19): 217-236.
Disponível em: <http://esmat.tjto.jus.br/publicacoes/index.php/revista_esmat/article/view/357>. Acesso
em: 21 fev. 2021.

De Luca, M.M.M.; Góis, A.D.; Costa, J.A.; Maia, A.J.R. 2015. Reputação corporativa e a criação de riqueza nas
empresas listadas na BM&FBovespa. Revista de Ciências da Administração, 17(42): 51-63. Disponível em:
<https://www.redalyc.org/pdf/2735/273541019005.pdf>. Acesso em: 21 fev. 2021.

Oliveira, A.R.; Franco, F.C. 2020. Superando crises com a reputação: análise do case Samarco. Destarte, 8(1):
73-91. Disponível em: <http://revistaadmmade.estacio.br/index.php/destarte/article/view/8904>. Acesso
em: 21 fev. 2021.

Orellano, V.I.F.; Quiota, S. 2011. Análise do retorno dos investimentos socioambientais das empresas
brasileiras. Revista de Administração de Empresas, 51(5), 471-484. Disponível em: <https://www.scielo.br/
scielo.php?pid=S0034-75902011000500005&script=sci_arttext>. Acesso em: 21 fev. 2021.

6.7. Modelos de Risco Cibernético


Um dos campos de pesquisa mais recente diz respeito ao risco cibernético. Os casos de ataques
cibernéticos têm afetado tanto pessoa física quanto pessoa jurídica. Por isso, as empresas têm
buscado modelos de como prever este tipo de risco. Há diversos contextos em que os modelos
de risco cibernético podem ser aplicados, sendo que o pesquisador pode propor, em seu TCC, um
modelo para medir o risco cibernético com o objetivo de antever fraudes digitais em empresas que
operam no contexto de e-commerce, servindo como referencial teórico a pesquisa realizada por
Olivas e Pivetta (2011), em que os autores analisaram as vulnerabilidades advindas do ambiente
digital, principalmente com respeito ao uso da internet, elucidando suas características e perigos.

54
TCC em Data Science e Analytics: áreas e linhas de pesquisa

Além disso, o aluno tem a possibilidade de realizar em seu TCC um levantamento por meio de
questionário de quais são os desafios que as empresas enfrentam em relação aos riscos cibernéticos.
Outra ideia interessante de pesquisa é analisar os meios de fraudes digitais no âmbito financeiro e
de investimento. Assim, um estudo de caso com algumas pessoas que sofreram fraude em alguma
transação de investimento para tentar identificar possíveis causas e oferecer soluções de segurança
cibernética seria muito bem-vindo para formulação de um TCC. Neste caso, o aluno poderia usar o
estudo realizado por Camargo et al. (2015) como referencial teórico, considerando que os autores
propuseram nesta pesquisa uma estratégia de prevenção de fraude em investimentos pessoais,
para que o usuário possa se certificar da veracidade do negócio que irá realizar.

Referências
Almada, G.M.; Freitas, C.O.A. 2020. A governança da internet e o Comitê Gestor da Internet do Brasil:
o papel educacional no combate às fake news. Civilistica, 9(3): 1-22. Disponível em: <https://civilistica.
emnuvens.com.br/redc/article/view/462>. Acesso em: 21 fev. 2021.

Camargo, T.M.F.; Ribeiro, D.; Santos, M.S.C. 2015. Prevenção de Fraudes em Investimentos
Pessoais. Revista de Ciências Gerenciais, 19(30): 65-68. Disponível em: <https://revista.pgsskroton.
com/index.php/rcger/article/view/3667>. Acesso em: 21 fev. 2021.

Kabanda, S.; Tanner, M.; Kent, C. 2018. Exploring SME cybersecurity practices in developing
countries. Journal of Organizational Computing and Electronic Commerce, 28(3): 269-282. Disponível em:
<https://www.tandfonline.com/doi/abs/10.1080/10919392.2018.1484598>. Acesso em: 21 fev. 2021.

Olivas, J.R.; Pivetta, L.P. 2011. Fraudes eletrônicas e o atual cenário do cibercrime. Ciência &
Consciência, 1(1): 1-10. Disponível em: <http://www.periodicos.ulbra.br/index.php/cec/article/
view/4517>. Acesso em: 21 fev. 2021.

Schuster, H.A. Moretti, B.R. Silva, M.Z. 2018. Institucionalização de práticas de gestão de risco
em uma concessionária de distribuição de energia elétrica. Contabilidade Vista & Revista, 29(3):
23-49. Disponível em: <https://revistas.face.ufmg.br/index.php/contabilidadevistaerevista/article/
view/3565>. Acesso em: 21 fev. 2021.

Wilke, V.C.L. 2020. Pós-verdade, fake news e outras drogas. Logeion: filosofia da informação, 7(1):
8-27. Disponível em: <http://revista.ibict.br/fiinf/article/view/5427>. Acesso em: 21 fev. 2021.

6.8. Gestão de Investimentos e Valuation de Empresas


As ferramentas de Analytics também podem ser utilizadas para a gestão de investimentos e
valuation das empresas. Assim, poderia ser proposto um modelo de valuation para “fintechs” ou
startups, considerando a existência de poucas pesquisas sobre o tema. Também seria interessante
criar um modelo de valuation para pequenas empresas do setor têxtil ou de outro setor, tendo como
fonte de pesquisa inicial o estudo realizado por Pereira et al. (2011) que apresentam um método que
permite construir modelos para avaliar empresas de pequeno porte no Brasil, com base nas percepções
e juízos de valor do investidor. Tal estudo também poderia ser aplicado no setor educacional, industrial
ou financeiro. Pesquisas também podem ser realizadas para verificar a maturidade e potencial de
operacionalização do negócio, conforme proposto por Farrel e Gallagher (2014) os quais verificaram as
implicações da valuation da maturidade da gestão de risco empresarial no setor industrial.

Referências
Almeida, N.S.; Silva, R.F.; Ribeiro, K.C.D.S. 2010. Fluxo de caixa livre: valuation de uma empresa do setor aéreo
brasileiro. Revista de Contabilidade da UFBA, 4(1): 71-83. Disponível em: <https://periodicos.ufba.br/index.php/
rcontabilidade/article/view/4281>. Acesso em: 21 fev. 2021.

Farrell, M.; Gallagher, R. 2015. The valuation implications of enterprise risk management maturity. Journal
of Risk and Insurance, 82(3): 625-657. Disponível em: <https://onlinelibrary.wiley.com/doi/abs/10.1111/
jori.12035>. Acesso em: 21 fev. 2021.

55
R. B. dos Santos e F. Vasconcelos

Jacques, K.A.S.; Fernandes, V.D.C.; Queiroz, L.M.; Cunha, M.F. 2021. Qual é o valor da empresa? O caso de
valuation da empresa Magazine Luiza. Revista ambiente contábil, 13(1): 359-377. Disponível em: <https://
periodicos.ufrn.br/ambiente/article/view/19563>. Acesso em: 21 fev. 2021.

Moutinho, R.A.; Magnani, V.M.; Ambrozini, M.A. 2019. Análise do impacto do fluxo de caixa livre sobre
o retorno acionário das companhias de capital aberto no mercado acionário brasileiro. Revista Mineira
de Contabilidade, 20(2): 55-69. Disponível em: <https://revista.crcmg.org.br/rmc/article/view/871>.
Acesso em: 21 fev. 2021.

Pereira, M.F.; de Lima, M.V.A.; de Lima, M.A. 2011. Valuation: Uma contribuição multicritério às empresas de
pequeno porte. Revista de Administração FACES Journal, 10(2): 187-208. Disponível em: <http://revista.fumec.
br/index.php/facesp/article/view/642>. Acesso em: 21 fev. 2021.

Rojo-Ramírez, A.A. 2014. Privately held company valuation and cost of capital. Journal of Business Valuation
and Economic Loss Analysis, 9(1): 1-21. Disponível em: <https://www.degruyter.com/document/doi/10.1515/
jbvela-2013-0017/html>. Acesso em: 21 fev. 2021.

56
pecege.com
/pecege

(19) 3377.0937

(19) 9 9948.4769

ISBN 978-65-86664-72-0

Você também pode gostar

pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy