0% acharam este documento útil (0 voto)

105 visualizações49 páginas

APOSTILA de Bioestatistica

1. O documento apresenta os conteúdos de duas disciplinas de estatística básica ministradas na Universidade Federal Rural do Rio de Janeiro: IC280 - Estatística Básica e IC281 - Introdução à Bioestatística. 2. Inclui definições preliminares de somatório, notação matemática e exemplos. Também apresenta exercícios sobre somatórios para cálculo e interpretação. 3. Apresenta breve introdução sobre o que é estatística, sua importância e algumas aplicações

Enviado por

luana

Direitos autorais

Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.

Formatos disponíveis

Baixe no formato PDF, TXT ou leia on-line no Scribd

0% acharam este documento útil (0 voto)

105 visualizações49 páginas

APOSTILA de Bioestatistica

Enviado por

luana

Direitos autorais

Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.

Formatos disponíveis

Baixe no formato PDF, TXT ou leia on-line no Scribd

Você está na página 1/ 49

UNIVERSIDADE FEDERAL RURAL DO RIO DE JANEIRO

INSTITUTO DE CIÊNCIAS EXATAS

Departamento de Matemática
Área Estatística

IC 280 – ESTATÍSTICA BÁSICA

IC 281 – INTRODUÇÃO À BIOESTATÍSTICA

2019
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

CONTEÚDO I
ANÁLISE EXPLORATÓRIA DE DADOS:

CONTEÚDO PRELIMINAR: SOMATÓRIO

A notação de somatório é de grande importância para a estatística, pois a operação de
adição é fundamental nesta ciência. Utiliza-se Σ (sigma), letra grega maiúscula, para facilitar a
representação de somas com grande número de parcelas/termos.
As principais representações são:
n

∑x
i =1
i → Soma simples → x1 + x2 + x3 + ... + xn

∑x
i =1
2
i → Soma de quadrados → x12 + x 22 + ... + x n2

2
 n 
 ∑ xi  → Quadrado da soma → (x1 + x2 + ... + xn)2
 i =1 
n

∑ (x y ) → Soma de produto → x1y1 + x2y2 + ... + xnyn

i =1
i i

n n

∑x ∑y
i =1
i
i =1
i → Produto das somas → (x1 + x2 + ... + xn) (y1 + y2 + ... + yn)

n
A expressão ∑x
i =1
i é lida da seguinte maneira: Somatório ou soma de x índice i, com i

variando de 1 até n.
A finalidade do índice i é indicar a ordem de cada parcela/termo da soma. O número
inferior indica a ordem da primeira parcela e o superior da última parcela. São também
chamados de limite inferior e limite superior, respectivamente.

1
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

EXERCÍCIO PROPOSTO

1 – Considere as notas de duas disciplinas (X e Y) para um grupo de seis alunos.

X = {90 ; 95 ; 97 ; 98 ; 100 ; 60}
Y = {60 ; 70 ; 80 ; 60 ; 90 ; 75}
Calcular:
6
a) ∑X
i =1
i

6
b) ∑X
i =1
i
2

2
 6 
c)  ∑ X i 
 i =1 
6
d) ∑ (X Y )
i =1
i i

 6  6 
e)  ∑ X i . ∑ Yi 
 i =1   i =1 

EXERCÍCIO COMPLEMENTAR

1 – Considere os dados:
i fi Xi
1 3 10
2 5 11
3 9 15
4 10 19
5 2 21
6 1 26
Calcular os seguintes somatórios:
2
 6 
6
 ∑ fi X i 
∑(f X ) − 
2 i =1
6 i i 6

6 6 6 ∑( f X ) i i
i =1
∑f i
a) ∑X i b) ∑ f i c) ∑ ( f i X i
2
) d) i =1
6
e) 6
i =1

i =1 i =1 i =1
∑ i =1
fi ∑f
i =1
i −1

Gabarito
a) 102 b) 30 c) 8.098 d) 15,93 e) 16,62

2
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

1 – INTRODUÇÃO
A estatística é uma ciência de obtenção de informações a partir de dados numéricos.
Ela é entendida como a matemática aplicada a dados observados, fornecendo métodos para
geração, coleta, organização, descrição, análise e interpretação dos dados. O estudo estatístico
tem se revelado essencial no mundo moderno. Ao verificar os diferentes meios de
comunicação (internet, rádio, televisão, jornais e revistas) evidencia-se a relevância da
estatística para a sociedade.
A estatística faz parte do cotidiano de cada cidadão. Ela se mostra imprescindível para
a tomada de decisões, para a resolução de problemas e, principalmente, para a pesquisa
científica. Seu objetivo é proporcionar conhecimentos a partir de dados. Na estatística os
dados não são apenas números, mas sim números com um contexto, tornando-os
informativos. É fundamental conhecer a origem dos dados, contextualizando-os com as
questões a serem solucionadas. Devido à automatização na resolução de cálculos, bem como
na construção de gráficos e tabelas, o mais relevante que podemos obter de um estudo
estatístico é a compreensão de ideias e a interpretação dos resultados.
Vejamos algumas situações onde a estatística se torna foco central:
Na pesquisa eleitoral, quando os percentuais de intenção de votos de cada candidato
são divulgados;
Na pesquisa médica, quando se anuncia os benefícios de um novo medicamento;
Na pesquisa de opinião pública sobre um novo produto lançado no mercado;
Na divulgação de vítimas (mortos, feridos e desabrigados) por sinistros naturais;
Na avaliação do desempenho de determinado setor econômico;

2 – DEFINIÇÕES
População: é o conjunto constituído por todos os indivíduos (ou objetos) que
apresentam pelo menos uma variável/característica comum, cujo comportamento tem-
se interesse em analisar.
Amostra: é definida como um subconjunto da população, ou seja, uma parte dos
indivíduos (ou dos objetos) da população, por meio da qual se faz inferência (tomada
de decisões/conclusões) sobre as características da população. Uma amostra tem que
ser representativa, ou seja, apresentar comportamento característico similar ao da
população.
Variável: é uma característica qualquer do objeto em estudo. Pode ser classificada
como:

3
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

Variável Qualitativa: É uma variável que assume como possíveis “valores” atributos
ou qualidades do objeto em estudo. São, portanto, por natureza, dados não numéricos.
Variáveis Qualitativas denotam características individuais das unidades sob análise,
tais como: sexo; estado civil; naturalidade; raça; grau de instrução; etc. Classificação
da Variável Qualitativa:
i) Variável Qualitativa Nominal: quando não existe nenhuma ordenação em
suas realizações. Exemplos: cor dos olhos; sexo; tipo sanguíneo; etc.
ii) Variável Qualitativa Ordinal: quando existe uma ordenação em suas
realizações. Exemplos: nível de escolaridade; estágio da doença; classificação em
concurso; etc.
Variável Quantitativa: É uma variável que assume como possíveis valores números,
resultantes de uma contagem ou mensuração. Ou seja, são variáveis que assumem
valores em uma escala métrica definida por uma origem e uma unidade, por exemplo:
idade; salário; peso; etc. Classificação da Variável Quantitativa:
i) Variável Quantitativa Discreta: quando assume um número finito ou infinito
enumerável de valores. Exemplos: número de filhos por casal; quantidade de leitos em
um hospital; número de acidentes em uma rodovia em determinado período; etc.
ii) Variável Quantitativa Contínua: quando assume um número infinito de
valores, em geral, em intervalos de números reais. Exemplos: medidas de altura e de
peso; taxa de glicose; nível de colesterol; etc.
Dados: são as informações inerentes às variáveis que caracterizam os elementos
(unidades de observação) que constituem a população ou a amostra em estudo. Os
dados obtidos em pesquisas devem ser analisados e interpretados com auxílio de
métodos estatísticos. Inicialmente deve-se fazer uma análise descritiva, que consiste
em organizar e descrever os dados, identificando medidas de posição e de dispersão.
Rol: é a classificação dos dados (valores numéricos) em ordem crescente, o que
facilita a verificação da composição do conjunto de dados, identificando o maior e o
menor valor, além de elementos que podem se repetir. Por exemplo, considere o Rol
de 40 valores (em decibéis) do nível de ruído do tráfego de automóveis:
58,0 59,5 59,5 60,2 60,2 60,2 60,2 62,5 62,5 62,5
62,5 62,5 65,0 65,0 65,0 65,0 65,0 65,0 65,0 65,0
66,4 66,4 66,4 66,4 66,4 66,4 66,4 67,0 67,0 67,0
67,0 67,0 67,0 68,3 68,3 68,3 68,3 70,1 70,1 71,9

4
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

A obtenção de dados referentes às variáveis requer sua representação por meio de

tabelas e/ou gráficos. Posteriormente, torna-se útil calcular frequências simples, acumuladas e
relativas.
Como exemplo, suponha que um médico esteja interessado em fazer um levantamento
sobre algumas características de pacientes atendidos em uma clínica. Os dados podem ser
organizados em uma tabela. Geralmente os indivíduos (unidades de observação) são
representados nas linhas e as variáveis (qualitativas ou quantitativas) nas colunas.
Tabela 01 – Características de pacientes atendidos em uma clínica.
Peso Tipo de Nº. de Classificação da
Paciente Sexo (kg) Tratamento Convulsões Doença
1 M 89,8 A 1 Leve
2 F 64,2 A 3 Severa
3 M 91,0 B 2 Moderada
... ... ... ... ... ...
59 M 78,8 A 0 Leve
60 F 71,0 B 3 Moderada
Variáveis qualitativas nominal: Sexo e Tipo de Tratamento;
Variável qualitativa ordinal: Classificação da Doença;
Variável quantitativa discreta: Número de Convulsões;
Variável quantitativa contínua: Peso.

3 – APRESENTAÇÃO DOS DADOS

3.1 Representação Tabular

É a representação das informações/dados por meio de uma tabela. A tabulação dos
dados é uma maneira simples e eficiente de visualizar os resultados de uma pesquisa,
facilitando a compreensão e a interpretação dos dados.

3.1.1 Distribuição de Frequências

Ao estudar uma variável, o maior interesse do pesquisador é conhecer o
comportamento (a distribuição) desta variável por meio de seus valores. Podemos representar
a distribuição dos valores de uma variável por meio de uma Tabela de Frequências. A Tabela
de Distribuição de Frequências é o arranjo dos valores numéricos (ou atributos/qualidades)
com suas respectivas frequências.

5
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

Tabela 02 – Distribuição de Frequências.

Variável Frequência (fi) Freq. Relativa (fri) Freq. Freq. Acumulada
Acumulada (fai) Relativa (fari)
Nível 1 f1 fr1 f1 far1
Nível 2 f2 fr2 f1 + f2 far2
... ... ... ... ...
Nível k fk frk n fark = 1,0
Total f1 + f2 + ... + fk fr1 + fr2 + ... + frk =
=n 1,0
em que:
n é o número total de observações do conjunto de dados;
k é o número de níveis da variável em estudo;
i é o índice que indica o nível da variável;
fi (Frequência) é o número de observações (frequência) para o nível i da variável;
fri (Frequência Relativa) é o quociente da frequência (fi) correspondente ao nível i
fi
pelo número total de observações (n), isto é, fri = ;
n
fai (Frequência Acumulada) é a soma do número de observações (frequência) do nível
i (fi) com as freqüências dos níveis anteriores ao nível i (fi – 1; fi – 2; ...) da variável;
fari (Frequência Acumulada Relativa) é o quociente da frequência acumulada (fai)
f ai
correspondente ao nível i pelo número total de observações (n), isto é, fari = ;
n
Exemplos:
Tabela 03 – Distribuição de Frequências de 2.000 empregados da Companhia MB segundo o
grau de instrução (Variável Qualitativa).
Grau de Instrução Frequência (fi) fri fai fari
Fundamental 650 0,325 (32,5%) 650 0,325 (32,5%)
Médio 1.020 0,510 (51,0%) 1.670 0,835 (83,5%)
Superior 330 0,165 (16,5%) 2.000 1,000 (100%)
Total 2.000 1,0

Tabela 04 – Distribuição de Frequências dos empregados da seção de orçamentos da

Companhia MB segundo o número de filhos (Variável Quantitativa Discreta).
Nº. de Filhos Frequência (fi) fri fai fari
0 4 0,20 (20%) 4 0,20 (20%)
1 5 0,25 (25%) 9 0,45 (45%)
2 7 0,35 (35%) 16 0,80 (80%)
3 3 0,15 (15%) 19 0,95 (95%)
4 1 0,05 (5%) 20 1,00 (100%)
Total 20 1,00

6
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

A construção de tabelas de Distribuição de Frequências para Variáveis Quantitativas

Contínuas não resume as observações (dados numéricos) em um grupo menor, pois
dificilmente existem observações iguais. A solução empregada é agrupar os dados por
Intervalos de Classe, e assim obter a tabela de Distribuição de Frequências em Intervalos de
Classe.
Tabela 05 – Distribuição de Frequências em Intervalos de Classe do peso (kg) de 44 alunos
(Variável Quantitativa Contínua).
Intervalos de Classe Xi Frequência (fi) fri fai fari
(Peso – kg)
45├── 55 50 10 0,23 (23%) 10 0,23 (23%)
55├── 65 60 7 0,16 (16%) 17 0,39 (39%)
65├── 75 70 11 0,25 (25%) 28 0,64 (64%)
75├── 85 80 9 0,20 (20%) 37 0,84 (84%)
85├── 95 90 7 0,16 (16%) 44 1,00 (100%)
Total 44 1,00
em que:
Xi (Ponto Médio) é a média dos limites inferior (extremo esquerdo) e superior
Linf + Lsup
(extremo direito) correspondente ao intervalo de classe i, isto é, PMi = ou
2
hi
PMi = Li + ;
2
hi (Amplitude) é a diferença entre o limite superior e o limite inferior correspondente
ao intervalo de classe i, isto é, hi = Lsup – Linf .

Ao resumir os dados referentes a uma variável quantitativa contínua por meio da

Distribuição de Frequências em Intervalos de Classe perdem-se algumas informações. Por
exemplo, ao analisar apenas a tabela não se sabe quais são os onze pesos da classe
correspondente ao intervalo de 65 a 75. Na tentativa de perder pouca informação em relação
aos dados originais pode-se supor que todos os onze pesos daquela classe fossem iguais ao
65 + 75
ponto médio da referida classe, isto é, = 70 .
2
A determinação do número de Intervalos de Classe (k) exige determinado
conhecimento do pesquisador com a variável (dados) em estudo. Entretanto, deve-se atentar
que um pequeno número de intervalos de classe perde-se muita informação. Em contrapartida,
um grande número de classes prejudica o objetivo em resumir os dados. Normalmente,
sugere-se a utilização de 5 a 15 intervalos de classe (5 ≤ k ≤ 15) com a mesma amplitude (h).

7
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

Os gráficos geralmente utilizados para representar dos dados em uma Distribuição de

Frequências em Intervalos de Classe são: Histograma; Polígono de Frequência e Polígono de
Frequência Acumulada (Ogiva).
O Histograma é a representação gráfica por meio de retângulos justapostos, com base
sobre o eixo das abscissas (X). A base do retângulo é a amplitude (h) do Intervalo de Classe
(IC). A altura do retângulo é representada pela frequência (fi) do correspondente intervalo de
classe i.
Histograma

O Polígono de Frequência representa uma linha poligonal que une os pontos

resultantes da junção dos pontos médios (PMi), localizados no eixo das abscissas (X), e das
frequências (fi), localizadas no eixo das ordenadas (Y), correspondentes aos intervalos de
classe i. Para fechar o polígono (linha poligonal), unem-se os extremos da figura com o eixo
das abscissas, nos quais estariam os pontos médios dos intervalos de classe anterior e
posterior ao da primeira e última classe, respectivamente.
Polígono de Frequência

8
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

O Polígono de Frequência Acumulada ou Ogiva representa uma linha poligonal

ascendente resultante da junção dos limites superiores (Lsup), localizados no eixo das abscissas
(X), e das frequências acumuladas (fai), localizadas no eixo das ordenadas (Y),
correspondentes aos intervalos de classe i. Deve-se fechar APENAS o lado esquerdo da linha
poligonal ascendente (extremo esquerdo) com o eixo das abscissas, no qual estaria o limite
inferior do primeiro intervalo de classe.
Polígono de Frequência Acumulada

Este gráfico (Polígono de Frequência Acumulada) pode ser utilizado para fornecer
informações adicionais. Por exemplo, para saber o valor correspondente X de uma
determinada frequência acumulada conhecida.

4 – MEDIDAS DE POSIÇÃO OU TENDÊNCIA CENTRAL

O resumo dos dados provenientes da observação de uma Variável Quantitativa por
meio de gráficos e tabelas de frequências fornece informações sobre o comportamento
(distribuição) desta variável. As Medidas de Posição ou Medidas de Tendência Central são
empregadas para resumir todo o conjunto de dados por meio de um ou alguns valores que
possam ser representativos para todos os dados.

4.1 Média Aritmética

^ ^
É representada por X , m ou µ . A média aritmética é definida como a soma dos
valores (Xi) de todas as observações dividida pelo número total de observações (n), ou seja:
n

X + X 2 + ... + X n ∑X i
X= 1 = i =1

n n

9
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

Se os valores de X1, X2, ..., Xn ocorrem com respectivas frequências (pesos) fi (pi), tem-
se a Média Aritmética Ponderada, definida por:
n

f1 X 1 + f 2 X 2 + ... + f n X n ∑f X
i =1
i i
Xp= =
f1 + f 2 + ... + f n n

∑f i =1
i

Para dados agrupados em uma Distribuição em Intervalos de Classe temos que:

Xi = Ponto Médio do i’ésimo Intervalo de Classe;
fi = Frequência do i’ésimo Intervalo de Classe.

4.1.1 Propriedades da Média Aritmética

A soma algébrica dos desvios de um conjunto de números em relação à média
n
aritmética é zero. Ou seja: ∑(X
i =1
i − X ) = 0;

Somando ou subtraindo uma constante (k) a cada um dos valores de um conjunto de

dados (X1, X2, ..., Xn) a média aritmética ficará somada ou subtraída por esta constante;
Multiplicando ou dividindo cada um dos valores de um conjunto de dados (X1, X2, ...,
Xn) por uma constante (k) a média aritmética ficará multiplicada ou dividida por esta
constante;
Se todo o conjunto de dados apresenta valores iguais a um determinado
número/constante (k, k, ..., k) então a média aritmética é igual a este número/constante
(k).

4.2 Moda
A moda (Mo) de um conjunto de dados/observações é o valor/atributo que ocorre com
maior frequência. É uma medida que pode ser calculada para quaisquer tipos de dados:
Variáveis Quantitativas e Qualitativas. De acordo com o comportamento da série estatística
de dados podemos ter: Série Amodal; Série Unimodal; Série Bimodal; ...; Série Multimodal.
EX1: {1, 2, 3, 4, 5} O conjunto não tem moda (Amodal);
EX2: {1, 2, 2, 2, 3, 4} Mo = 2 (Unimodal);
EX3: {1, 1, 2, 3, 4, 4, 5, 5} Mo = 1, 4 e 5 (Trimodal ou Multimodal).

10
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

Para dados agrupados em uma Distribuição em Intervalos de Classe, a moda é

determinada identificando o intervalo de classe que apresenta maior frequência (fi), chamado
de classe modal e, posteriormente, aplicando-se a fórmula:
 ∆1 
Mo = Linf . +  h
 ∆1 + ∆ 2 
em que:
Linf. = limite inferior da classe modal;
∆1 = diferença entre a frequência da classe modal e a frequência da classe anterior a
classe modal;
∆2 = diferença entre a frequência da classe modal e a frequência da classe posterior a
classe modal;
h = amplitude da classe modal.

4.3 Mediana
A mediana (Md) é definida como sendo à medida que ocupa a posição central de uma
série de observações, estando os dados ordenados (Rol) segundo suas grandezas. A mediana é
o valor abaixo ou acima do qual se tem a metade dos dados/observações, isto é, 50% dos
dados estão abaixo e 50% estão acima do valor da mediana.
Primeiramente deve-se identificar a posição do elemento mediano em um conjunto de
dados (n) em Rol para, posteriormente, verifica-se qual é o respectivo valor da mediana.
Caso em que o número de dados (n) é ímpar:
PMd = X n +1
2

Caso em que o número de dados (n) é par:

X n + X n+2
2 2
PMd =
2
Para dados agrupados em uma Distribuição em Intervalos de Classe, a mediana é
determinada identificando o intervalo de classe que apresenta o elemento mediano (P), ou
seja, a classe que apresenta o valor resultante da divisão do número de observações/dados (n)
 n
por dois  P =  , chamada de classe mediana. Posteriormente aplica-se a fórmula:
 2

 P − f aai 
Md = Linf . +  h
 fi 

11
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

em que:
 n
P = posição do elemento mediano  P =  ;
 2
Linf. = limite inferior da classe mediana;
faai = frequência acumulada da classe anterior a classe mediana;
fi = frequência da classe mediana;
h = amplitude da classe mediana.

4.4 Outras Medidas de Posição – Quantis

Algumas vezes estamos interessados não apenas em dividir o conjunto de dados em
duas partes iguais, mas sim em quatro, dez ou cem partes iguais. Essas medidas são chamadas
de Quartis (4), Decis (10) e Percentis (100), respectivamente, dividindo a distribuição de
dados em grupos de mesmo tamanho.
A determinação dessas medidas é semelhante ao da mediana, com a diferença na
determinação do valor do Quantil (P).

4.4.1 Quartil
Os Quartis dividem o conjunto de dados em quatro partes do mesmo tamanho. O
primeiro quartil (Q1) deixa um quarto das observações abaixo e três quartos acima. O segundo
quartil (Q2 = Md) deixa metade dos valores abaixo e metade dos valores acima. Já o terceiro
quartil (Q3) deixa três quartos dos valores abaixo e um quarto acima.
Esquema dos Quartis:

Para dados agrupados em uma Distribuição em Intervalos de Classe, o quartil é

determinado identificando o intervalo de classe que apresenta o elemento:
i.n
PQi =
4
Posteriormente a identificação da classe que apresenta o valor PQi aplica-se a fórmula:
 PQi − f aai 
Qi = Linf +  h
 fi 
em que:

12
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

 i.n 
PQi = posição do elemento do Quartil i  PQi =  ;
 4
Linf. = limite inferior da classe do Quartil i;
faai = frequência acumulada da classe anterior a classe do Quartil i;
fi = frequência da classe do Quartil i;
h = amplitude da classe do Quartil i.

4.4.2 Decil
Os Decis dividem o conjunto de dados em dez partes do mesmo tamanho. Esquema
dos Decis:

Para dados agrupados em uma Distribuição em Intervalos de Classe, o Decil é

determinado identificando o intervalo de classe que apresenta o elemento:
i.n
PDi =
10
Posteriormente a identificação da classe que apresenta o valor PDi aplica-se a fórmula:
 P − f aai 
Di = Linf . +  Di h
 fi 
em que:
 i.n 
PDi = posição do elemento do Decil i  PDi =  ;
 10 
Linf. = limite inferior da classe do Decil i;
faai = frequência acumulada da classe anterior a classe do Decil i;
fi = frequência da classe do Decil i;
h = amplitude da classe do Decil i.

4.4.3 Percentil
Os Percentis dividem o conjunto de dados em cem (100) partes do mesmo tamanho.
Esquema dos Percentis:

13
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

Para dados agrupados em uma Distribuição em Intervalos de Classe, o Percentil é

determinado identificando o intervalo de classe que apresenta o elemento:
i.n
PPi =
100
Posteriormente a identificação da classe que apresenta o valor PPi aplica-se a fórmula:
 P − f aai 
Pi = Linf . +  Pi  h
 fi 
em que:
 i.n 
PPi = posição do elemento do Percentil i  PPi = ;
 100 
Linf. = limite inferior da classe do Percentil i;
faai = frequência acumulada da classe anterior a classe do Percentil i;
fi = frequência da classe do Percentil i;
h = amplitude da classe do Percentil i.

5 – MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE

O resumo de um conjunto de dados por meio de uma única medida de posição pode
ocultar informações sobre a variabilidade dos dados. Dois conjuntos de dados com medidas
de posição semelhantes, por exemplo a média, podem ficar sujeitos a erros em suas
interpretações, aferindo sobre sua homogeneidade, ou não, de maneira inadequada. As
observações podem estar mais ou menos centradas em torno da média, sendo as medidas de
dispersão estatísticas utilizadas para avaliar essa variabilidade dos dados.

5.1 Variância
A variância mede a dispersão dos valores em torno da média, sendo representada por
^
Var, s2 ou σ 2 . Ela é dada pela soma dos quadrados dos desvios em relação à média
aritmética dividido por (n – 1) graus de liberdade (g.l.), ou seja:
2
 n 
n n
∑ Xi 
∑ ( X i − X ) 2 ∑ X i2 −  i =1 
SQD n
Var = s2 = = i =1 = i =1
n −1 n −1 n −1
Se os valores X1, X2, ..., Xn estiverem associados as frequências f1, f2, ..., fn, a variância
é definida por:

14
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

2
 n 
n
 ∑ fi X i 
∑ f i X i2 −  n 
i =1

2
i =1
∑ fi
i =1
s = n

∑f
i =1
i −1

Para dados agrupados em uma Distribuição em Intervalos de Classe temos que:

fi = frequência do i’ésimo Intervalo de Classe;
Xi = ponto médio do i’ésimo Intervalo de Classe.

5.2 Desvio Padrão

^
O desvio padrão é representado por DP, s ou σ . Ele é definido como a raiz quadrada
positiva da variância. O desvio padrão é uma medida de variabilidade definida na mesma
unidade das observações (dados) originais. Um desvio padrão grande significa que as
observações se dispersam muito em torno da média, ao passo que quando pequeno as
observações se concentram próximas à média, indicando pequena variabilidade entre as
observações.

DP = s = Var = s 2

5.3 Coeficiente de Variação

O coeficiente de variação (C.V.) é definido por:
DP
CV(%) = . 100
X
A grande vantagem desta medida (C.V.) é que ela é adimensional, ou seja, independe
das unidades de medida, permitindo a comparação de diferentes conjuntos de dados. Quanto
maior o C.V. mais heterogênea é a amostra. Ao passo que quando o C.V. é de pequena
magnitude indica homogeneidade na amostra.

5.4 Erro Padrão da Média

A média aritmética ( X ) é uma estatística que depende da amostra considerada, não
sendo um valor exato. A determinação do erro no cálculo da média é feita por meio da relação
do desvio padrão e do tamanho da amostra (n). O erro padrão da média é definido por:
DP
SX =
n

15
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

6 – MEDIDA DE ASSIMETRIA
A medida de Assimetria é um indicador da distribuição dos dados, sendo definida pelo
Coeficiente de Assimetria de Pearson (As):
X − Mo
As =
DP
De acordo com essa estatística (As) a distribuição pode ser classificada como:
Simétrica → As = 0;
Assimétrica Negativa (ou à esquerda) → As < 0;
Assimétrica Positiva (ou à direita) → As > 0.
Essas classificações podem ser assim esquematizadas:

7 – ANÁLISE BIDIMENSIONAL
Aprendemos a organizar e resumir informações pertencentes a uma única variável (ou
único conjunto de dados). Entretanto, frequentemente há interesse em analisar o
comportamento simultâneo de duas ou mais variáveis (quantitativas e/ou qualitativas).

7.1 Coeficiente de Contingência: Variáveis Qualitativas

No caso de variáveis bidimensionais qualitativas, os dados podem ser resumidos em
Tabelas de Dupla Entrada (ou Tabelas de Contingência), os quais são provenientes de
contagens.
Exemplo: Suponha que se queira analisar o comportamento simultâneo de duas
variáveis “Sexo” e “Nível de atividade física”, cujos dados estão contidos na tabela abaixo.
Tabela 06 – Tabela de contingência das variáveis: Sexo e Nível de Atividade Física.
Sexo
Nível de Atividade Física Feminino Masculino Total
Ativo 0 4 4
Médio 5 6 11
Sedentário 12 18 30
Total 17 28 45

16
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

A linha dos totais fornece a distribuição da variável sexo, ao passo que a coluna dos
totais fornece a distribuição da variável nível de atividade física. As distribuições assim
obtidas são chamadas de Distribuições Marginais das Variáveis Sexo e Nível de Atividade
Física.
O Coeficiente de Contingência é uma medida que quantifica a associação entre duas
variáveis, sendo bastante utilizado quando se tem duas variáveis qualitativas, embora também
possa ser aplicado no caso de variáveis quantitativas agrupadas em intervalos de classe.
Inicialmente, obtêm-se as diferenças entre os valores observados (oij) na pesquisa e os valores
esperados (eij). Essas diferenças são chamadas de desvios [d = (oij - eij)]. A estatística Qui-
Quadrado ( χ 2 ) leva em consideração esses desvios, sendo definida pela expressão:

 (oij − eij )2 
χ2 = ∑ ∑j  e 
i  ij 
Os valores esperados em cada célula da tabela de contingência podem ser
determinados por:

eij =
(Total da linha i )x(Total da coluna j)
(Total geral)
De acordo com Pearson, o Coeficiente de Contingência (C) proposto é definido:

χ2
C= ,
χ2 +n
em que:
n é o número total de observações.

O Coeficiente de Contingência (C) acima descrito pode variar entre 0 e 1, sendo que a
proximidade de zero (0) indica falta de associação entre as variáveis, ao passo que sua
proximidade de um (1) torne-se um indicativo de alta associação entre as variáveis.

17
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

7.2 Coeficiente de Correlação: Variáveis Quantitativas

No caso de variáveis bidimensionais quantitativas, os dados são provenientes de
mensurações.
^
O Coeficiente de Correlação (r ou ρ ) quantifica o grau de associação entre duas
variáveis quantitativas (não agrupadas em intervalos de classe) X e Y. Considere as amostras
de duas variáveis quantitativas X (ex. peso) e Y (ex. altura) mensuradas em n indivíduos:

Xi (Peso) X1 X2 X3 .......... Xn

Yi (Altura) Y1 Y2 Y3 .......... Yn

O Coeficiente de Correlação entre as duas variáveis X e Y (peso e altura) é definido

por:
n n

n ∑ X i ∑ Yi
^
Cov( X , Y ) SPXY ∑X Y
i =1
i i − i =1

n
i =1

rxy = ρ xy = … Cov(X,Y) = =
Var ( X ).Var (Y ) n −1 n −1

O Coeficiente de Correlação assume valores entre –1 e +1. Valores positivos

correspondem a uma associação diretamente proporcional, enquanto que os valores
negativos correspondem a uma associação inversamente proporcional. Valores iguais ou
próximos de zero são indicativos de que não existe associação entre as variáveis estudadas.
Um procedimento bastante útil para verificar a existência de associação entre as
variáveis é o Gráfico de Dispersão, por meio da representação dos pares de valores (Xi e Yi)
em um sistema cartesiano.

18
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

EXERCÍCIOS PROPOSTOS

1 – Um estudante obteve as seguintes notas parciais nas provas de Estatística:

Prova Peso Nota
1ª 1 5,0
2ª 1 7,0
3ª 2 5,0
4ª 4 7,0
Considerando que as provas apresentam pesos distintos, qual a média final do
estudante na disciplina?

2 – Considere o conjunto de dados: {3 ; 8 ; 9 ; 3 ; 8 ; 8 ; 9 ; 8 ; 9 ; 1}. Determinar:

a) Tabela de Distribuição de Frequências;
b) Média ; Moda ; Mediana;
c) Variância ; Desvio Padrão;
d) Erro Padrão da Média;
e) Coeficiente de Variação.

3 – A tabela abaixo apresenta a Distribuição de Frequências em Intervalos de Classe das

notas de um exame final feito por estudantes matriculados na disciplina de Estatística.
Intervalos de Classe Frequência (fi)
0,00├── 2,00 8
2,00├── 4,00 14
4,00├── 6,00 17
6,00├── 8,00 12
8,00├── 10,00 14
Determinar:
a) Os gráficos da Distribuição em Intervalos de Classe:
a.1) Histograma;
a.2) Polígono de Frequência;
a.3) Polígono de Frequência Acumulada (Ogiva);
b) Média;
c) Moda;
d) Mediana;
e) Quartil 1 (Q1);
f) Variância;
g) Desvio Padrão;

19
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

h) Coeficiente de Variação;
i) Erro Padrão da Média;
j) Nota acima da qual se encontram 60% dos dados;
k) O percentual de alunos que obtiveram nota superior a 7,50;
l) Coeficiente de Assimetria.

4 – Em um experimento para testar a resistência de Eucalyptus à ferrugem (patógeno),

determinado número de plantas de três espécies diferentes de Eucalyptus foram infectadas
artificialmente. Após certo tempo contou-se o número de plantas doentes. Os resultados estão
na tabela abaixo. Determinar o Coeficiente de Contingência (C).
Plantas E. citrioda E. urophylla E. cloeziana Total
Doentes 6 10 80 96
Sadias 104 90 30 224
Total 110 100 110 320

5 – Sete clones de cacau foram avaliados para Número Total de Frutos Colhidos (NTFC) e
Número Total de Frutos Sadios (NTFS). Determinar o Coeficiente de Correlação (r) entre as
variáveis NTFC e NTFS.
Clones CAB443 CAB444 CAB447 CAB450 CAB452 CAB453 CAB454
NTFC (X) 92,00 75,40 60,40 100,60 46,20 97,60 42,00
NTFS (Y) 66,40 44,80 41,40 82,40 33,40 77,60 29,40

20
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

EXERCÍCIOS COMPLEMENTARES

1 – Considere os dados: {12; 17; 17; 17; 10; 10; 9; 9; 9; 12; 12; 6; 6; 6; 17; 17; 12; 12; 9; 9; 9;
12; 12; 12; 12}. Determinar:
a) Tabela de Distribuição de Frequências;
b) Média, Mediana e Moda;
c) Erro padrão da média e Coeficiente de variação;
d) Considere que os dados foram obtidos incorretamente. As medidas apresentam erros
de modo que todos os valores da série tenham que ser multiplicados por um fator de
correção igual a 1,1. Corrigindo o suposto erro, qual seria o novo valor da média, do
erro padrão da média e do coeficiente de variação?
e) Coeficiente de Assimetria.

2 – Para cada série de dados abaixo, determinar: Tabela de Distribuição de Frequências;

Média; Moda; Mediana; Variância; Desvio Padrão; Erro Padrão da Média e Coeficiente de
Variação.
a) {1; 3; 3; 4; 5; 6; 6};
b) {9; 8; 1; 3; 8; 3; 4; 6};
c) {88; 82; 91; 93; 86; 84}.

3 – Uma prova consta de três questões com pesos (Pi) iguais a 1, 2 e 3, para as notas (Xi) da
1ª, 2ª e 3ª questão, respectivamente (i = 1, 2, 3). Considerar o intervalo de valores de zero a
dez em cada questão. Determinado aluno obteve nota oito (8) na prova. Qual nota ele
conseguiu na 1ª questão, sabendo que na 2ª questão obteve nota seis (6) e na 3ª nota nove (9)?

4 – Em um grupo de 600 hóspedes de determinado hotel tem-se as seguintes estatísticas com

relação ao tempo de permanência no hotel:
Média = 9 dias;
1º Quartil = 5 dias;
3º Quartil = 15 dias;
Coeficiente de variação = 20%.
Determinar:
a) Quantos hóspedes permaneceram mais de 15 dias;
b) Quantos hóspedes permaneceram entre 5 e 15 dias;

21
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

c) O desvio padrão para o tempo de permanência;

d) Supondo que cada um dos 600 hóspedes permaneça mais dois dias, calcular: a média,
o desvio padrão e o coeficiente de variação.

5 – Um caminhão cujo peso vazio é de 3.200 kg será carregado com 470 caixas de 11 kg
cada, 360 caixas de 9 kg cada, 500 caixas de 4 kg cada e 750 caixas de 6 kg cada. O motorista
do caminhão pesa 75 kg e a lona de cobertura da carga pesa 48 kg.
a) Sabendo-se que este caminhão tem que passar por uma balança que só permite a
passagem de veículos com peso máximo de 16 toneladas, pergunta-se: Ele passará
pela balança? JUSTIFICAR;
b) Qual o peso médio das caixas carregadas no caminhão?

6 – A tabela abaixo apresenta os resultados, em pontos, da prova final da Disciplina de

Estatística de 80 estudantes.
20 28 20 25 21 25 21 23 23 23
28 34 30 33 30 33 30 32 30 30
35 40 35 39 35 39 37 38 38 38
40 49 40 47 40 45 42 45 43 44
50 55 50 54 50 53 51 52 52 52
55 57 55 57 55 57 55 57 55 56
57 65 58 65 58 65 60 63 60 62
67 88 68 88 72 85 73 80 74 75

A partir de uma tabela de Distribuição de Frequências em Intervalos de Classe

determinar: (Dados: k = 9; h = 8 e Limite Inferior = 20. Adotar intervalo fechado à esquerda).
a) Os pontos médios;
b) As frequências simples (fi) e acumulada (fai);
c) As frequências relativas simples (fri) e acumulada (fari);
d) Os gráficos: Histograma, Polígono de Frequência Simples e Polígono de Frequência
Acumulada;
e) Média, Mediana e Moda;
f) O percentual de alunos que obtiveram mais de 50 pontos;
g) O percentual de alunos que obtiveram menos de 40 pontos;
h) 3º Quartil ; 6º Decil e 40º Percentil;
i) Variância, Desvio Padrão e Coeficiente de Variação.

22
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

7 – Os desvios tomados em relação à média aritmética de um conjunto de dados são: {-7;

-5; -1; 0; 0; 1; 4; 4; 4}. Sabendo-se que para o conjunto de dados X = 45, determinar:
a) O conjunto de dados;
b) Moda;
c) Mediana;
d) Variância;
e) Desvio Padrão;
f) Coeficiente de Variação.

8 – A série de dados abaixo se refere às medidas tomadas de uma amostra de cães.

Cães 1 2 3 4 5 6 7 8 9 10
Peso (kg) 23,0 22,7 21,2 21,5 17,0 28,4 19,0 14,5 19,0 19,5
Comprimento (cm) 104 105 103 105 100 104 100 91 102 99

Determinar, para cada característica avaliada (peso e comprimento), as estatísticas:

a) Média;
b) Mediana;
c) Moda;
d) Variância;
e) Desvio Padrão;
f) Erro Padrão da Média;
g) Coeficiente de Variação;
h) Qual das duas características é mais homogênea? JUSTIFICAR pelo C.V.(%);
i) Coeficiente de Correlação entre as duas características.

9 – Completar a tabela abaixo demonstrando o raciocínio utilizado.

Classes PM fi fai fri
├── 10 5 0,0625
├── 20 8
├── 19 0,075
├──
├── 10 33
├── 0,15
├── 15 60
├── 0,125
├── 10 80

23
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

Determinar:
a) Média, Mediana e Moda;
b) Variância, Desvio Padrão e Coeficiente de Variação;
c) 1º Quartil, 2º Decil e 30º Percentil;
d) Valor acima do qual se encontram 60% dos dados;
e) Curtose.

10 – Duas turmas A e B com nA = 50 e nB = 80, apresentaram médias X A = 65 e X B = 70 e

variâncias s A2 = 225 e s B2 = 235 . Qual é a turma mais homogênea? JUSTIFICAR pelo
C.V.(%).

11 – Um pesquisador dispõem das seguintes informações a respeito de uma amostra de

valores:
Média = 50,34
Somatório do quadrado de cada valor da amostra = 150.000
Número de elementos/valores da amostra = 52
Calcular as medidas de dispersão possíveis a partir das informações fornecidas.

12 – Cem (100) animais foram divididos em dois grupos: 1º grupo com 56 animais e 2º grupo
com 44 animais. No primeiro grupo, que foi vacinado contra determinada doença, 47 animais
não adoeceram. No segundo grupo, que não recebeu a vacina, 28 animais não adoeceram.
a) Construir a Tabela de Contingência;
b) Calcular o Coeficiente de Contingência.

24
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

Gabarito

1 – b) X = 11,4 Md = 12 Mo = 12
c) s( X ) = 0,6904 CV(%) = 30,285%
d) X = 12,54 s( X ) = 0,7594 CV(%) = 30,285%
e) – 0,1738

2–
X Mo Md s2 s s( X ) CV(%)
a) 4,0 3e6 4,0 3,333 1,825 0,689 45,62%
b) 5,25 3e8 5,0 8,5 2,915 1,030 55,52%
c) 87,333 Amodal 87,0 17,466 4,179 1,706 4,78%

3–9

4 – a) 150
b) 300
c) 1,8
d) 11 ; 1,8 ; 16,36%

5 – a) Não
b) 7,17 kg

6 – e) X = 48,20 Md = 48,44 Mo = 55,809

f) 47,82% ≈ 48% dos alunos com mais de 50 pontos
g) 36,248% dos alunos com menos de 40 pontos
h) Q3 = 58,73 D6 = 53,684 P40 = 42,00
2
i) s = 272,128 s = 16,496 CV(%) = 34,23%

7 – a) {38 ; 40 ; 44 ; 45 ; 45 ; 46 ; 49 ; 49 ; 49}
b) Mo = 49
c) Md = 45
d) s2 = 15,5
e) s = 3,937
f) CV(%) = 8,748%

25
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

8–
Peso (X) Comprimento (Y)
a) X 20,58 kg 101,3 cm
b) Md 20,35 kg 102,5 cm
c) Mo 19,00 kg 100; 104 e 105 cm
d) s2 14,2973 kg2 17,7889 cm2
e) s 3,7812 kg 4,2177 cm
f) s( X ) 1,1957 kg 1,3338 cm
g) CV(%) 18,37% 4,16%
h) Comprimento
i) rxy = 0,7710

9 – a) X = 56,5 Md = 60,833 Mo = 68,75

b) s2 = 592,65 s = 24,34 CV(%) = 43,07%
c) Q1 = 37,5 D2 = 30,0 P30 = 46,0
d) 54
e) K = 0,275

10 – Turma B

11 – s2 = 357,37 s = 18,9 CV(%) = 37,54% s( X ) = 2,62

12 – b) C = 0,226

26
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

CONTEÚDO II
PROBABILIDADE

1 – INTRODUÇÃO E DEFINIÇÕES
A teoria da probabilidade representa um instrumento para a construção e análise de
modelos matemáticos relacionados a fenômenos aleatórios. Ao estudarmos um fenômeno
aleatório estamos diante de um experimento cujo resultado não pode ser determinado, mas
sim ter o seu comportamento probabilístico.

Modelo Determinístico → É o modelo em que a partir das condições sobre as quais

um experimento é executado pode-se determinar o seu resultado.
Ex.: s = -1,6 t2 + v0t

Modelo Não-Determinístico ou Probabilístico → É o modelo em que às condições

de execução de um experimento não permitem determinar o seu resultado, mas sim
apenas um comportamento probabilístico do resultado a ser observado.
Ex.: Previsão do tempo

Experimentos Probabilísticos ou Aleatórios → São experimentos que repetidos

diversas vezes, sob condições idênticas, podem fornecer resultados distintos entre as
repetições, ou seja, os resultados podem não ser os mesmos.
Ex1: Lançar um dado e verificar sua face superior
Ex2: Lançar uma moeda e verificar sua face superior

Espaço Amostral → Representa o conjunto de todos os possíveis resultados de um

experimento aleatório. Notação: “S”.
S1: {1;2;3;4;5;6}
S2: {Ca ; Co}

Evento → É um subconjunto qualquer do espaço amostral, ou mesmo um conjunto

particular de resultados do “S”. Será útil considerarmos o “S” e o conjunto vazio (Ø)
como eventos. O primeiro é considerado evento certo → P(S) = 1. O segundo evento
impossível → P(Ø) = 0.

27
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

Ex1.: Evento A = Ocorrer face ímpar no lançamento de um dado → A = {1;3;5}

Ex2.: Evento B = Ocorrer face par no lançamento de um dado → B = {2;4;6}
Ex3.: Evento C = Ocorrer face superior a dois (2) no lançamento de um dado → C = {3;4;5;6}

Eventos Mutuamente Exclusivos (Disjuntos) → Dois (ou mais) eventos são

mutuamente exclusivos se, e somente se, a ocorrência de um evento impedir a
ocorrência do (s) outro (s). Ou seja, eles não possuem ponto em comum.
Ex.: Eventos A e B

Eventos Não-Mutuamente Exclusivos ou Eventos Quaisquer → Dois (ou mais)

eventos são designados como eventos quaisquer quando eles podem ocorrer
simultaneamente (possuem pontos em comum).
Ex.: Eventos A e C ou Eventos B e C

União de Eventos (U) → É a união de dois (ou mais) eventos, representando a

ocorrência de pelo menos um dos eventos “A” ou “B”, para o caso “A U B”.
Ex.: A U B = {1;2;3;4;5;6}

Interseção de Eventos (∩) → É a interseção de dois (ou mais) eventos, representando

a ocorrência simultânea dos eventos “A” e “B”, para o caso “A ∩ B”.
Ex.: A ∩ B = { Ø }

Eventos Complementares → Dois ou mais eventos são complementares quando sua

união resulta no “S”.
Ex.: Eventos A e B, ou seja,
o evento B é definido como sendo o “AC” (Evento A Complementar)

Frequência Relativa → Considere um experimento e os eventos “A” e “B” a ele

associado. Se após “n” realizações/repetições do experimento forem observados nA e
nB resultados favoráveis aos eventos A e B, respectivamente, então suas frequências
relativas serão: fA = nA/n e fB = nB/n.
Propriedades da Frequência Relativa:
0 ≤ fA ≤ 1
fA = 1 ↔ nA = n

28
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

fA = 0 ↔ nA = 0
Se A ∩ B = Ø, então fAUB = fA + fB

Princípio da Regularidade Estatística → Este princípio afirma que se um

experimento for realizado sob as mesmas condições e um grande número de vezes, a
frequência relativa tende a se estabilizar e se aproximar do seu valor de probabilidade.
A Probabilidade de um determinado evento (A) deve satisfazer as seguintes
condições:
0 ≤ P(A) ≤ 1
P(S) = 1
Se A ∩ B = Ø, então P(A U B) = P(A) + P(B); Esta condição pode ser
generalizada para o caso de um número finito de eventos mutuamente
exclusivos → P(A1 U A2 U ... U An) = P(A1) + P(A2) + ... + P(An)
P(S) = P(A) + P(AC) = 1
Se os elementos do “S” são equiprováveis, isto é, apresentam a mesma chance
de ocorrer, definimos a probabilidade do evento A pela expressão:
n º elementos − A
P(A) =
n º elementos − S

2 – TEOREMAS DE PROBABILIDADE

Teorema 1 → Seja o Evento Vazio (Ø), então: P(Ø) = 0

Teorema 2 → AC denomina-se Evento A Complementar, então: P(AC) = 1 – P(A)

Teorema 3 → Sejam “A” e “B” dois Eventos Quaisquer associados ao mesmo

experimento aleatório, então:
P(A U B) = P(A) + P(B) – P(A ∩ B)

Teorema 4 → Sejam “A”, “B” e “C” três Eventos Quaisquer associados ao mesmo
experimento aleatório, então:
P(A U B U C) = P(A) + P(B) + P(C) – P(A ∩ B) – P(A ∩ C) – P(B ∩ C) + P(A ∩ B ∩ C)

29
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

3 – INDEPENDÊNCIA DE EVENTOS
Sejam “A” e “B” dois eventos quaisquer, associados ao mesmo experimento aleatório.
Dizemos que “A” e “B” são dois Eventos Independentes se for válida a igualdade:
P(A ∩ B) = P(A) x P(B)

Supondo a presença de três eventos quaisquer “A”, “B” e “C”. Eles serão
independentes se, e somente se, forem válidas as seguintes condições:
i) P(A ∩ B) = P(A) x P(B)
P(A ∩ C) = P(A) x P(C)
P(B ∩ C) = P(B) x P(C)
ii) P(A ∩ B ∩ C) = P(A) x P(B) x P(C)

4 – PROBABILIDADE CONDICIONAL
Sejam “A” e “B” dois eventos quaisquer, associados ao mesmo experimento aleatório.
A probabilidade do evento “A” ocorrer uma vez que o evento “B” tenha ocorrido, ou seja, a
Probabilidade Condicional de “A” dado que “B” ocorreu, é definida por:
P( A ∩ B)
P(A/B) = , para P(B) > 0
P ( B)
(Lê-se: Probabilidade Condicional de “A” dado que “B” ocorreu)
OBS: Quando P(B) = 0 tem-se que P(A/B) = 0.

4.1 Teorema do Produto das Probabilidades

Vimos que a Probabilidade Condicional do evento “A” na hipótese de que o evento
“B” tenha ocorrido é dada por:
P( A ∩ B)
P(A/B) =
P ( B)
Multiplicando ambos os lados da igualdade obtêm-se:

P(A ∩ B) = P(A/B) x P(B)

Este resultado é designado pelo nome “Teoria do Produto das Probabilidades”. É de

grande utilidade, pois permite o cálculo da probabilidade de interseção de eventos a partir da
probabilidade condicional.

30
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

EXERCÍCIOS PROPOSTOS

1 – De acordo com o experimento de cada alínea defina seu espaço amostral (S):
a) Lançamento de uma moeda duas vezes;
b) Jogar um dado e observar sua face superior;
c) Uma fábrica produz determinado artigo. Da linha de produção são retirados três
artigos, cada qual classificado como Bom (B) ou Defeituoso (D).

2 – Determinar os eventos de acordo com os experimentos das alíneas do exercício anterior:

a) Evento A → Ocorrência de uma cara;
b) Evento B → Ocorrência de face menor que seis;
c) Evento C → Obtenção de dois artigos defeituosos.

3 – Um lote é formado por dez artigos bons, quatro com defeitos menores e dois com defeitos
graves. Um artigo é escolhido ao acaso. Calcular a probabilidade de que:
a) Ele não tenha defeitos;
b) Ele não tenha defeitos graves;
c) Ele seja perfeito ou tenha defeitos graves.

4 – Considere um experimento aleatório e os eventos A e B associados a ele. Sabendo-se que

P(A) = 1/2; P(B) = 1/3 e P(A ∩ B) = 1/4. Determinar:
a) P(AC);
b) P(BC);
c) P (A U B).

5 – Sejam A, B e C três eventos associados ao mesmo espaço amostral. Sabe-se que P(A) =
P(B) = 1/3; P(C) = 1/4; P(A ∩ B) = 1/8; P(A ∩ C) = P(B ∩ C) = 1/9 e P(A ∩ B ∩ C) = 1/20.
Calcular as seguintes probabilidades:
a) De um evento “X”, que consiste na realização de pelo menos um dos eventos A, B ou
C;
b) Os eventos A, B e C são independentes?
c) Os eventos A, B e C são mutuamente exclusivos?

31
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

6 – O quadro abaixo apresenta a divisão dos alunos matriculados em determinado Instituto de

Matemática.
Sexo
Curso Masculino Feminino Total
Matemática Pura (MP) 70 40 110
Matemática Aplicada (MA) 15 15 30
Estatística (E) 10 20 30
Computação (C) 20 10 30
Total 115 85 200

Determinar:
a) A probabilidade de o aluno estar matriculado em Matemática Pura (MP);
b) A probabilidade de o aluno ser do sexo feminino;
c) Dado que o aluno escolhido ao acaso esteja matriculado no curso de Estatística (E),
qual a probabilidade de ser do sexo feminino;
d) Sabendo que uma aluna foi escolhida, qual a probabilidade dela estar matriculada no
curso de Estatística (E).

7 – Em determinado instituto de ciências exatas 25% dos estudantes foram reprovados em

Matemática (M), 15% em Estatística (E) e 10% em Matemática e Estatística. Um estudante é
selecionado aleatoriamente.
a) Se ele foi reprovado em Estatística, qual é a probabilidade de ter sido reprovado em
Matemática?
b) Se ele foi reprovado em Matemática, qual é a probabilidade de ter sido reprovado em
Estatística?
c) Qual é a probabilidade de ter sido reprovado em Matemática ou Estatística?
d) Qual é a probabilidade de ter sido reprovado apenas em Estatística?

32
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

EXERCÍCIOS COMPLEMENTARES
1 – Defina e dê exemplo:
a) Espaço Amostral;
b) Evento;
c) Evento Mutuamente Exclusivo;
d) Evento Não Mutuamente Exclusivo;
e) Evento Independente;
f) Evento Dependente.

2 – Considerando o espaço amostral de um experimento constituído do lançamento de dois

dados perfeitamente simétricos, pede-se:
a) Qual a probabilidade de que o primeiro dado mostre a face 5 e o segundo a face 3?
b) Qual a probabilidade de que os dois dados mostrem um número par?
c) Qual a probabilidade de que o primeiro dado mostre um número menor em sua face
em comparação ao segundo dado?

3 – Uma moeda perfeita é lançada três vezes. Qual é a probabilidade de ocorrer:

a) Pelo menos uma cara?
b) Só cara ou só coroa?
c) Exatamente uma cara?

4 – Em um processo produtivo, 10% dos itens fabricados apresentam defeito. Qual a

probabilidade na escolha aleatória de dois itens:
a) De os dois serem defeituosos?
b) De os dois não serem defeituosos?
c) De pelo menos um ser defeituoso?

5 – Em determinada universidade, dos 300 estudantes matriculados no curso de Ciências

Biológicas, 100 cursam Química, 80 Estatística e 30 ambas as disciplinas. Ao escolher
aleatoriamente um estudante de Ciências Biológicas, qual a probabilidade de ele cursar:
a) Química?
b) Estatística?
c) Estatística e Química?
d) Nenhuma das duas disciplinas?

33
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

e) Estatística ou Química?

6 – Sejam A, B e C três eventos de um mesmo espaço amostral S. Sabendo-se que: P(A) =

P(B) = 1/3; P(C) = 1/4; P(A∩B) = 1/8; P(A∩C) = P(B∩C) = 1/9 e P(A∩B∩C) = 1/20.
Calcular as probabilidades:
a) De ocorrer pelo menos um dos eventos A, B ou C;
b) De que não se realize nenhum dos eventos A, B ou C;

7 – Jogam-se dois dados. Se as duas faces mostram números diferentes, qual a probabilidade
de que uma das faces seja o 4?

8 – Quatro equipes A, B, C e D participam de um torneio que premiará uma única equipe

campeã. Com relação às probabilidades de cada equipe vencer o torneio, as equipes C e D são
equiprováveis, a equipe A é duas vezes mais provável de vencer em relação a equipe B, sendo
esta (equipe B) duas vezes mais provável de vencer em relação as equipes C e D. Pede-se:
Qual a probabilidade de que as equipes C ou D sejam campeãs?

9 – Se P(A) = 1/2 e P(B) = 1/4. Calcular: P(AC), P(BC) e P(AUB), se:

a) A e B são eventos mutuamente exclusivos;
b) A e B são eventos quaisquer e independentes.

10 – Uma urna contém cinco bolas pretas, três vermelhas e duas brancas. Foram extraídas três
bolas com reposição. Qual a probabilidade de terem sido duas bolas pretas e uma vermelha?

11 – Uma caixa A contém oito peças, das quais três são defeituosas. Uma outra caixa B
contém cinco peças, das quais duas são defeituosas. Uma peça é retirada aleatoriamente de
cada caixa.
a) Qual a probabilidade “p” de ambas as peças não serem defeituosas?
b) Qual a probabilidade “p” de que uma peça seja defeituosa e a outra não?

12 – Uma urna contém 12 bolas: cinco brancas, quatro vermelhas e três pretas. Outra urna
contém 18 bolas: cinco brancas, seis vermelhas e sete pretas. Uma bola é retirada de cada
urna. Qual a probabilidade de que as duas bolas sejam da mesma cor?

34
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

Gabarito
2 – a) 1/36
b)1/4
c) 5/12

3 – a) 7/8
b)1/4
c) 3/8

4 – a) 0,01
b) 0,81
c) 0,19

5 – a) 1/3
b) 4/15
c) 1/10
d)1/2
e)1/2

6 – a) 223/360
b) 137/360

7 – 1/3

8 – 1/4

9 – a) 1/2 3/4 3/4

b) 1/2 3/4 5/8

10 – 9/40

11 – a) 3/8
b) 19/40

12 – 35/108

35
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

CONTEÚDO III
VARIÁVEIS ALEATÓRIAS

1 – INTRODUÇÃO E CONCEITOS
Variável Aleatória (v.a.) é toda e qualquer variável associada a uma probabilidade, isto
é, os seus valores estão relacionados a um experimento aleatório.
Exemplo: Ao jogar uma moeda duas vezes, o espaço amostral associado a este
experimento aleatório será: S = { Ca Ca ; Ca Co ; Co Ca ; Co Co}.
Podemos considerar, por exemplo, uma variável aleatória “X”, que pode ser
representada pelo número de caras na face superior da moeda. Temos então uma função
definida no espaço amostral, que será denominada variável aleatória, sendo designada, em
geral, por uma letra maiúscula (X, Y, Z, ...).:
Espaço Amostral (S) Variável Aleatória (X)
Ca Ca 2
Ca Co 1
Co Ca 1
Co Co 0

Uma variável aleatória pode ser classificada como Variável Aleatória Discreta (v.a.d.)
ou Variável Aleatória Contínua (v.a.c.).

Variável Aleatória Discreta: Seja X uma Variável Aleatória (v.a.). Se o conjunto de

valores de X for finito ou infinito enumerável, então X é definida como uma Variável
Aleatória Discreta (v.a.d.), sendo obtida mediante a alguma forma de contagem.
Exemplos: Número de filhos do sexo masculino de um casal; Número de peças
defeituosas produzidas por uma máquina; etc.

Variável Aleatória Contínua: Seja X uma Variável Aleatória (v.a.). Se X puder

assumir todo e qualquer valor em algum intervalo “a ≤ X ≤ b”, em que a e b podem
assumir de “- ∞” a “+ ∞”, então X é definida como uma Variável Aleatória Contínua
(v.a.c.). A v.a.c. está associada a um espaço amostral infinito e não enumerável.
Exemplos: Altura dos estudantes da UFRRJ; Peso de um lote (grupo) de animais; etc.

36
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

2 – DISTRIBUIÇÕES DE BERNOULLI E BINOMIAL: Variável Aleatória Discreta

Uma Variável Aleatória Discreta (v.a.d.) X que segue Distribuição de Bernoulli
admite apenas dois tipos de resultados, denominados sucesso e fracasso. A probabilidade de
ocorrência de sucesso é igual ao parâmetro “p”.
Exemplos de experimentos que seguem Distribuição de Bernoulli:
Lançar uma moeda e observar a face superior. Os possíveis resultados são cara
(sucesso) e coroa (fracasso) OU cara (fracasso) e coroa (sucesso);
Lançar um dado e observar se ocorre à face 5, designada como sucesso, enquanto que
a ocorrência das outras faces representariam o fracasso (faces 1; 2; 3; 4 ou 6).

Seja X o número de sucessos em n repetições independentes e idênticas de um

Experimento de Bernoulli caracterizado com o parâmetro p. Neste caso, X passa a seguir a
Distribuição Binomial caracterizada pelos parâmetros n (nº de repetições) e p (probabilidade
de sucesso).
Notação da Distribuição Binomial: X ~ B (n ; p) → X segue Distribuição Binomial
com n repetições e p probabilidade de sucesso.
A média [Esperança Matemática: E(...)] e a variância de uma variável aleatória
discreta X que segue Distribuição Binomial são definidas por:
E(X) = n.p
V(X) = n.p.q, em que “q = 1 – p” (q = probabilidade de fracasso)

Exemplos de experimentos que seguem Distribuição Binomial:

n lançamentos de uma moeda, em que X = número de caras (sucesso);
n lançamentos de um dado, em que X = número de vezes que ocorre a face 5 (sucesso).

OBS: Ressaltar que a v.a.d. X que segue Distribuição Binomial pode assumir os valores:
X = {0 ; 1 ; 2 ; 3 ; ... ; n}

A Função de Probabilidade de uma v.a.d. X que segue Distribuição Binomial é

definida por:
n!
P(X = x) = C nx . p x .q n − x = . p x .q n − x ,
x!(n − x)!
em que:
p+q=1

37
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

3 – DISTRIBUIÇÃO NORMAL: Variável Aleatória Contínua

Uma Variável Aleatória Contínua (v.a.c.) X que segue Distribuição Normal é
caracterizada pelos parâmetros média (µ) e variância (σ2). Essa distribuição, também
denominada de Distribuição Simétrica, apresenta um gráfico em formato de sino (Curva
Normal).
A Função Densidade de Probabilidade de uma v.a.c. X que segue Distribuição
Normal é definida por:
1  x−µ  2
1 − .
2 σ 

f ( x) = .e , -∞ < x < ∞ ,
2πσ 2
em que:
e = 2,71828… ; π = 3,14159…
Notação da Distribuição Normal: X ~ N (µ ; σ2) → X segue Distribuição Normal com
média µ e variância σ2.

3.1 Características da Distribuição Normal

A curva normal é simétrica em torno de sua média (µ);
A área total abaixo da curva normal vale 1 (um). Devido a sua simetria, 50% da área
ficam à esquerda da média e 50% ficam à direita da média;
A média, a mediana e a moda são iguais (Distribuição Simétrica);
A Distribuição Normal fica completamente caracterizada identificando os parâmetros
µ e σ2 (µ pode assumir qualquer valor real e σ2 é sempre positiva);

3.2 Distribuição Normal Padrão ou Normal Reduzida

Uma v.a.c. X segue Distribuição Normal Padrão ou Normal Reduzida se X ~ N (0 ; 1),
ou seja, se X apresentar uma Distribuição Normal com média 0 e variância 1. A Função
Densidade de Probabilidade de uma v.a.c. X que segue Distribuição Normal Padrão é
definida por:
− x2
1
f ( x) = .e 2
, -∞ < x < ∞
2π
Os procedimentos matemáticos para definir percentuais (área abaixo da curva normal)
para uma v.a.c. X que segue Distribuição Normal Padrão é facilitado por ela estar tabelada.
Assim, para determinar uma área abaixo da Curva da Normal Padrão, entre dois pontos
quaisquer, não há necessidade de calcular a integral de sua Função Densidade de

38
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

Probabilidade. Para obter a área de interesse sob a Curva da Normal Padrão utiliza-se a
Variável Normal Padronizada (Z):
X −µ
Z= ,
σ
em que:
Z = Valor da Variável Normal Padronizada (valores tabelados);
X = Valor específico assumido pela v.a.c. X;
µ = Média da v.a.c. X;
σ = Desvio Padrão da v.a.c. X.
Notação da Variável Normal Padronizada (Z): Z ∼ N (µ ; σ2) → Z ∼ N (0 ; 1).

EXERCÍCIOS PROPOSTOS

1 – Um produtor de sementes afirma que 80% das sementes produzidas por determinado
genótipo germinam. Você planta cinco destas sementes compradas deste produtor. Qual a
probabilidade de:
a) Exatamente duas sementes germinarem;
b) Exatamente duas sementes não germinarem;
c) Pelo menos duas sementes germinarem;
d) Suponha que 100 pessoas estejam em situação análoga a sua, isto é, cada uma plantou
cinco destas sementes. Para quantas pessoas espera-se que exatamente duas sementes
germinem?

2 – Entre 2.000 famílias com quatro crianças cada, quantas famílias são esperadas que
apresentem:
a) Pelo menos um menino;
b) Exatamente uma menina.

3 – Calcular:
a) P(Z ≤ 1,82);
b) P(Z ≤ - 2,03);
c) P(- 2,55 ≤ Z ≤ 1,20);
d) P(Z ≥ 1,93).

39
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

4 – Seja X uma v.a.c. normalmente distribuída com média 850 e desvio padrão 48.
Determinar:
a) P(X < 790);
b) P(X > 940);
c) P(760 < X < 920).

5 – Em determinada região, a altura das pessoas apresenta distribuição normal com desvio
padrão de 8 cm e tal que 20% da população é constituída de pessoas com menos de 168 cm de
altura. Calcular o percentual de pessoas com altura:
a) Superior a 190 cm;
b) Entre 170 e 185 cm.

EXERCÍCIOS COMPLEMENTARES

1 – Determinar a probabilidade de que, em cinco lançamentos de um dado, apareça a face 3:

a) Duas vezes;
b) No máximo uma vez;
c) Ao menos duas vezes.

2 – Considere a amostragem de 3 peças que saem de uma linha de produção. Sabe-se que
desta linha de produção 20% das peças são defeituosas. Calcular as probabilidades:
a) De duas peças serem defeituosas;
b) De duas peças não serem defeituosas;
c) Quantas peças defeituosas são esperadas em uma amostragem de 500 peças?

3 – Sabe-se que 24% dos indivíduos que recebem determinado medicamento sofrem certos
efeitos colaterais. Se este medicamento for ministrado a quatro pacientes, qual a probabilidade
de:
a) Nenhum sofrer efeitos colaterais;
b) Pelo menos um sofrer efeitos colaterais;
c) Três não sofrerem efeitos colaterais.

40
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

4 – Em uma prova com 10 questões de múltipla escolha, cada uma com 5 alternativas e
somente uma correta, pede-se:
a) Em média, quantas questões acerta um aluno que marca todas as questões inteiramente
ao acaso?
b) Qual a probabilidade do aluno acertar 5 questões?

5 – Se X ~ B (16 ; 0,75), determinar:

a) A média de X;
b) A variância de X.

6 – Dada uma distribuição normal com µ = 100 e σ = 10. Determinar a probabilidade de que:
a) X > 75;
b) 75 < X < 85;
c) X > 112;
d) X < 80 ou X > 110;
e) X < 80 e X > 110;
f) X < 90 e X > 80;
g) Considere que 80% dos dados estejam entre dois valores X1 e X2 (simetricamente
distribuídos em torno da média). Encontrar os dois valores;
h) Considere que 70% dos dados estejam abaixo de determinado valor X. Encontrar o
valor de X.

7 – As notas de uma prova são normalmente distribuídas com média 73 e variância 225. Os
15% melhores alunos recebem o conceito A e os 11,9% piores alunos recebem o conceito R
(Reprovado). Pede-se:
a) Nota mínima para receber o conceito A?
b) Nota mínima para ser aprovado?
c) P(X ≥ 55,3).

8 – A obtenção dos pesos X, de um grande número de espigas de milho, mostrou que essa
variável é normalmente distribuída com média µ = 120g e desvio padrão σ = 10g. Em um
programa de melhoramento genético da cultura do milho, entre outras características, uma
linhagem deve satisfazer à condição 112g < X < 140g. Em um programa envolvendo 450

41
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

linhagens, qual deve ser o número provável de linhagens que atende a essa condição (112g <
X < 140g)?

9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído

com média 18 e variância 2,25. Um lote de 5.000 cabeças foi destinado ao frigorífico que
abate só a partir de um peso mínimo W. Sabendo-se que foram abatidas 4.200 cabeças, pede-
se:
a) O valor de W;
b) O número esperado de bovinos com peso entre 17 e 19 arrobas.

10 – Em indivíduos sadios, o consumo renal de oxigênio tem distribuição normal com média
12 cm3/min e desvio padrão 1,5 cm3/min. Determinar:
a) O percentual de indivíduos sadios com consumo inferior a 10 cm3/min;
b) O percentual de indivíduos sadios com consumo superior a 8 cm3/min;
c) O percentual de indivíduos sadios com consumo entre 9,4 e 13,2 cm3/min;
d) O valor do consumo renal que é superado por 98,5% dos indivíduos sadios.

Gabarito
1 – a) 625/3888 b) 3125/3888 c) 763/3888

2 – a) 0,096 b) 0,384 c) 100

3 – a) 0,3336 b) 0,6664 c) 0,4213

4 – a) 2 b) 0,0264

5 – a) 12 b) 3

6 – a) 0,9938 b) 0,0606 c) 0,1151 d) 0,1815

e) 0 f) 0,1359 g) 87,2 e 112,8 h) 105,2

7 – a) 88,6 b) 55,3 c) 0,8810

8 – 345

9 – a) 16,52 b) 2.486

10 – a) 0,0918 b) 0,9962 c) 0,7463 d) 8,745

42
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

CONTEÚDO IV
INFERÊNCIA ESTATÍSTICA

1 – INTRODUÇÃO
Ao retirar uma amostra aleatória de uma população e calcularmos a partir desta
amostra qualquer quantidade (medidas descritivas numéricas), encontramos estatísticas, ou
seja, chamaremos os valores calculados em função dos elementos da amostra de estatísticas.
As estatísticas, sendo variáveis aleatórias, terão alguma distribuição de probabilidade,
com uma média, uma variância, etc. A distribuição de probabilidade de uma estatística é
denominada de Distribuição Amostral.
A Inferência Estatística tem por objetivo fazer generalização sobre uma população
com base em dados de uma amostra. As populações são caracterizadas por medidas
descritivas numéricas chamadas de parâmetros. Muitas pesquisas tem por objetivo fazer
inferência a respeito de um ou mais parâmetros da população. Essa inferência pode ser por
meio de um único valor numérico (estimação por ponto), por uma amplitude de valores
numéricos (estimação por intervalo) ou pelo simples “sim” ou “não” (teste de hipótese).
A estimação por ponto utiliza a informação da amostra para chegar a um único valor
numérico ou ponto, que estima o parâmetro de interesse (parâmetro populacional). Ex: Média,
Variância, Coeficiente de Variação, etc.
A estimação por intervalo utiliza a informação da amostra para chegar a dois números,
entre os quais se espera encontrar o parâmetro de interesse. Caso este intervalo esteja
associado a uma probabilidade “1 – α”, tem-se um intervalo de confiança com coeficiente de
confiabilidade (c) de “1 – α”.

2 – CONCEITOS
População: é o conjunto de todos os elementos sobre os quais desejamos desenvolver
determinado estudo;
Amostra: é uma parte dos elementos da população, ou seja, qualquer subconjunto da
população;
Parâmetro: é uma medida utilizada para descrever uma característica da população;
Estatística: é uma medida utilizada para descrever uma característica da amostra, ou
seja, uma estatística T é uma função de X1, X2, X3, ..., Xn → T = f (X1, X2, X3, ..., Xn);

43
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

Estimador: é qualquer estatística T = f (X1, X2, X3, ..., Xn) utilizada para estimar uma
quantia desconhecida. Em geral, ele é representado por uma determinada fórmula;
Estimativa: é o valor numérico assumido pelo estimador quando os valores observados
(X1, X2, X3, ..., Xn) são considerados.

3 – DISTRIBUIÇÃO AMOSTRAL DA MÉDIA

A Distribuição Amostral de determinada Estatística (Ex. média) é a distribuição de
todos os possíveis valores que ela pode assumir calculados a partir de todas as possíveis
amostras de mesmo tamanho extraídas da população.
A Distribuição Amostral da Média é descrita para determinar o Valor Esperado
(Esperança Matemática) [E( X )] e o Desvio Padrão (Erro Padrão da Média) [σ( X )] da
distribuição das médias, sendo assim definidos:
σ
E( X ) = µ σ( X ) =
n

4 – INTERVALO DE CONFIANÇA (IC) PARA A MÉDIA

A estimação do intervalo de confiança para a média (µ) de uma característica da
população, cuja variância (σ2) seja conhecida e que apresente distribuição normal, pode ser
definida pela expressão:
σ
IC (µ) 1 – α: X ± Z α
2 n
O objetivo da estimação por intervalo é gerar intervalos pequenos que incluam o
verdadeiro parâmetro populacional (Ex.: µ) com alta probabilidade. O comprimento do
intervalo de confiança pode ser obtido pela diferença entre os limites superior e inferior (LSup.
– LInf.) do intervalo, ou também pela expressão:
 σ 
Comprimento do IC = 2.  Z α 
 2 n

A interpretação do IC pode ser assim mencionada: “Tem-se 1 – α (%) de confiança de

que o parâmetro populacional (µ) esteja compreendido no intervalo obtido”. Ou mesmo, “Se
construirmos n intervalos do mesmo tipo (tamanho e confiança), espera-se que em 1 – α (%)
deles contenha o verdadeiro parâmetro (µ)”.

44
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

EXERCÍCIOS PROPOSTOS

1 – Uma Variável Aleatória X apresenta Distribuição Normal, com média 100 e desvio padrão
10. Determinar:
a) P (95 < X < 105); Considerando X a média de uma amostra de 25 elementos.
b) O tamanho (n) que deveria ter a amostra para que P (90 < X < 110) fosse obtida a
95% de confiança.

2 – Seja X a durabilidade (em horas) de uma peça de equipamento, tal que σ = 5 horas.
Admita que 100 peças foram amostradas fornecendo uma durabilidade média ( X ) de 500
horas. Determinar:
a) Um intervalo de 95% de confiança para a média (µ);
b) O tamanho da amostra para o intervalo obtido: IC (µ)95%: 500 ± 1,63.

EXERCÍCIOS COMPLEMENTARES

1 – Para avaliar a precisão de uma balança de laboratório, pesa-se repetidas vezes um objeto
padrão de peso conhecido igual a 10 gramas. As leituras da balança tem distribuição normal.
Sabe-se que o desvio padrão das leituras é de 0,0002 gramas. Pesa-se o objeto cinco vezes e o
resultado médio é 10,0023 gramas.
a) Estabelecer um intervalo de 95% de confiança para a média das repetidas pesagens do
objeto;
b) Quantas pesagens devem entrar no cálculo da média a fim de que se obtenha uma
margem de erro de ± 0,0001 com 95% de confiança?

2 – Uma agência de propaganda, que atende a uma das principais estações de rádio, gostaria
de calcular a quantidade média de tempo que a audiência gasta diariamente ouvindo a rádio.
A partir de estudos anteriores determinou-se o desvio padrão de 45 minutos. Determinar:
a) O tamanho da amostra caso a agência queira ter 90% de confiança de estar correta em
um intervalo de ± 5 minutos;
b) O novo tamanho da amostra caso seja desejado um nível de 99% de confiança;
(considerar a mesma margem de erro da alínea anterior: ± 5 minutos)

45
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

c) Faça inferências a respeito dos tamanhos das amostras encontrados nas alíneas
anteriores (a e b), justificando o motivo de suas dimensões distintas.

3 – Estudos anteriores levam a supor que crianças de dois meses alimentadas exclusivamente
com leite do Tipo A sofrem um aumento de peso que segue distribuição normal, com média
desconhecida, porém com variância de 9.000 gramas2. Escolhe-se ao acaso 20 crianças de
dois meses, alimentando-as exclusivamente com leite do tipo A. Nesta amostra o aumento de
peso médio foi de 475 gramas. Estabelecer um intervalo de 99% de confiança para o aumento
médio do peso em crianças submetidas às condições apresentadas.

4 – O consumo mensal de calorias (kcal/g) de determinada espécie de esquilo segue

distribuição normal com desvio padrão 0,16. Recolheu-se uma amostra aleatória de dimensão
18 cuja média amostral do consumo de calorias foi de 0,41. Determinar:
a) Um intervalo de confiança a 95% para o consumo médio de calorias;
b) A dimensão da amostra para que um intervalo de confiança a 95% para o consumo
médio de calorias tenha amplitude (comprimento) 0,2.

5 – Qual a dimensão (tamanho) da amostra a recolher de uma população normal de valor

médio µ e desvio padrão 10, de modo que o intervalo de confiança para µ a 99% tenha
amplitude (comprimento) de uma unidade (1)?

Gabarito

1 – a) 10,0021247 ≤ µ ≤ 10,0024753 b) n = 15,37 ≈ 16

2 – a) n = 220,52 ≈ 221 b) n = 539,17 ≈ 540

3 – 420,27 ≤ µ ≤ 529,73

4 – a) 0,3361 ≤ µ ≤ 0,4839 b) n = 9,83 ≈ 10

5 – n = 2.662,56 ≈ 2.663

46
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

APÊNDICE

Esta Tabela será utilizada em prova. Portanto, não deverá conter informações
adicionais.

Nome: _______________________________________________________________

Matrícula / Curso: _____________________________________________________

47
IC280 – Estatística Básica e IC281 – Introdução à Bioestatística
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ