Guia ML2
Guia ML2
𝑉𝑃+𝑉𝑁 𝑉𝑃
Acurácia = Sensibilidade =
𝑉𝑃+𝑉𝑁+𝐹𝑁+𝐹𝑃 𝑉𝑃+𝐹𝑁
𝑉𝑁 𝑉𝑃
Redes Feedforward: Dados fluem de entrada para saída, sem Especificidade = Precisão =
loops.Dados são processados em uma única direção, da camada
𝑉𝑁+𝐹𝑃 𝑉𝑃+𝐹𝑃
de entrada para a camada de saída, passando por uma ou mais 𝑝𝑟𝑒𝑐𝑖𝑠ã𝑜 × 𝑠𝑒𝑛𝑠𝑖𝑏𝑖𝑙𝑖𝑑𝑎𝑑𝑒
F-Score= 2 ×
camadas ocultas. Características: •Fluxo Direto: Informações 𝑝𝑟𝑒𝑐𝑖𝑠ã𝑜 + 𝑠𝑒𝑛𝑠𝑖𝑏𝑖𝑙𝑖𝑑𝑎𝑑𝑒
fluem em uma única direção, sem loops ou feedback.
•Estrutura Simples: Cada camada é totalmente conectada à Verdadeiros Positivos (True Positive - TP): São os casos em
próxima. •Uso Comum: Principalmente para tarefas de que o modelo previu corretamente uma classe positiva (1) como
classificação e regressão. positiva. Falsos Positivos (False Positive - FP): São os casos
Backpropagation: Algoritmo de treinamento que ajusta os pesos em que o modelo previu incorretamente uma classe negativa (0)
minimizando a perda.Cálculo da Perda: Comparação da saída como positiva. Verdadeiros Negativos (True Negative - TN):
prevista com a saída real para calcular a perda. •Erro: O erro é São os casos em que o modelo previu corretamente uma classe
propagado de volta pela rede, da saída para a entrada. negativa como negativa. Falsos Negativos (False Negative -
•Gradientes: Gradientes são calculados para cada peso. FN): São os casos em que o modelo previu incorretamente uma
Atualização: Pesos são ajustados na direção que reduz a perda. classe positiva como negativa.
MLP: Rede feedforward com múltiplas camadas, incluindo Técnicas de Validação
camadas ocultas, treinada usando backpropagation. •Camada de •Validação Cruzada (Cross-Validation): Divide o conjunto de
Entrad, Camadas Oculta,Camada de Saída dados em subconjuntos de treino e teste, repetindo o processo
Aprendizagem Supervisionada: Normalmente treinado usando várias vezes para obter uma estimativa mais robusta do
backpropagation. Capacidade de Modelagem: Pode modelar desempenho do modelo. •Holdout: Divide os dados em conjunto
relações não-lineares complexas nos dados. Flexibilidade: Pode de treinamento e teste uma vez. Menos computacionalmente
ser configurado com diferentes números de camadas e neurônios intensivo, mas pode ter variância alta dependendo da divisão.
por camada. •Random Subsampling (Amostragem Aleatória): Divide os dados
em um conjunto fixo de treino e teste, o que pode levar a
CNN (Convolutional Neural Network) •CNN é um tipo variações nos resultados dependendo da aleatoriedade da
especializado de rede neural usada principalmente para divisão. •Bootstrapping: É útil para estimar a distribuição de uma
processamento de imagens e reconhecimento visual. •Camadas estatística de interesse, como a média ou o erro de generalização
Convolucionais: Realizam convoluções para extrair de um modelo, quando a distribuição original dos dados não é
características espaciais dos dados. •Camadas de Pooling: conhecida ou é difícil de obter.
Reduzem a dimensionalidade das representações espaciais. Avaliação de Classificadores
•Totalmente Conectadas: Camadas finais conectadas para Curvas ROC (Receiver Operating Characteristic): Gráfico que
produzir a saída final. •Uso Comum: Reconhecimento de mostra o desempenho do classificador à medida que o limite de
Imagens, Detecção de Objetos, Segmentação Semântica. decisão é variado. Matriz de Confusão: Tabela que mostra as
•Problemas: Explosão de Parâmetros: Com o aumento da classificações corretas e incorretas feitas por um classificador.
profundidade e largura da rede, o número de parâmetros pode Comparando Classificadores
crescer exponencialmente, levando a maior demanda Comparação direta entre diferentes modelos de Machine Learning
computacional e necessidade de mais dados de treinamento. para determinar qual deles é mais adequado para uma tarefa
Interpretabilidade Limitada: Às vezes, é difícil interpretar como específica.
e por que a rede faz suas predições. O teste de Wilcoxon Signed-Rank é um teste estatístico não
paramétrico usado para determinar se há diferença significativa
RNN (Recurrent Neural Network) •RNN é um tipo de rede neural entre pares de observações relacionadas. Ele é usado quando os
projetada para lidar com dados sequenciais, onde a saída atual dados não seguem uma distribuição normal ou quando a
depende não apenas dos dados atuais, mas também de dados diferença entre as observações é mais importante do que os
anteriores. •Recorrência: Possui conexões que permitem estados próprios valores absolutos.
ocultos (memória) que mantêm informações sobre sequências Cross-Validation: Aplicado para obter estimativas robustas do
desempenho de cada modelo e compará-los de maneira justa.