Apostila - Proc Mixed SAS PDF

Enviado por

Flávio Menezes

Direitos autorais

Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.

Formatos disponíveis

Baixe no formato PDF, TXT ou leia on-line no Scribd

0% acharam este documento útil (0 voto)

121 visualizações7 páginas

Apostila - Proc Mixed SAS PDF

Enviado por

Flávio Menezes

Direitos autorais

Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.

Formatos disponíveis

Baixe no formato PDF, TXT ou leia on-line no Scribd

Você está na página 1/ 7

Estimação de Modelos Lineares

Gerais Mistos utilizando o SAS®

O Modelo Linear Geral Misto (MLGM) enquadra-se numa classe

de modelos que tem sido tradicionalmente analisada através
de procedimentos de análise de variância. Nos MLGM exis-
tem três aspectos fundamentais: estimação e significância
dos efeitos fixos, predição dos efeitos aleatórios e estimação
das componentes de variância. Na análise de MLGM desbal-
anceados, a estimação das componentes de variância tem
importância extrema e depende da estrutura de covariância
e dos métodos de estimação utilizados. Este artigo pretende
apresentar os principais métodos de estimação do MLGM com
estruturas gerais de covariância dos efeitos aleatórios, dis-
poníveis no procedimento “proc mixed” do Statistical Analysis
System (SAS).

Luís Pereira – ESGHT

Lara Ferreira – ESGHT1

INTRODUÇÃO efeitos aleatórios como a estimação Patterson e Thompson (1971). Todos

dos efeitos fixos dependem da estima- estes métodos estão disponíveis no
Os MLGM são utilizados para ção das componentes de variância. procedimento “proc mixed” do SAS.
descrever um conjunto de dados cuja Segundo Scheffé (1959), o MLGM foi Searle et al. (1992) apresentaram
estrutura de tratamentos envolve amplamente estudado por Fisher em uma ampla discussão sobre estimação
alguns factores que são fixos e outros 1918, com grande repercussão nos es- de componentes de variância e análise
que são aleatórios, ou seja, modelos tudos de genética quantitativa. Tal mo- de modelos mistos, ilustrando-os por
lineares que contêm efeitos fixos e delo foi denominado pelo autor como meio de exemplos. Richardson e Welsh
aleatórios, independentemente da modelo de componentes de variância. (1995) apresentaram duas definições
média e do erro. Consequentemente, a Diversos métodos têm sido pro- de máxima verosimilhança robusta
análise de um modelo misto envol- postos para estimar as componentes e máxima verosimilhança restrita
ve duas partes: uma análise para a de variância, destacando-se o método robusta, e apresentaram também, por
parte aleatória e outra para a parte da máxima verosimilhança (Maximum meio de simulação, um estudo para
fixa. Nos MLGM a análise da parte Likelihood: ML) da autoria de a Hartley investigar as propriedades assimptó-
aleatória consiste na predição dos e Rao (1967), o método da estimação ticas e as vantagens de utilizar esses
efeitos aleatórios e na estimação das quadrática não enviesada de variância métodos robustos. Gilmour et al. (1995)
componentes de variância. A análise mínima (Minimum Variance Quadratic descreveram e aplicaram o algoritmo
da parte fixa consiste na estimação e Unbiased Estimation: MIVQUE) descrito Average Information (AI), na estimação
na realização de testes de hipóteses em Rao (1971) e o método da máxima de componentes de variância pelo
sobre funções estimáveis dos efeitos verosimilhança restrita (Restricted Ma- método da REML, em modelos mistos
fixos. Em geral, tanto a predição dos ximum Likelihood: REML) descrito por com erros correlacionados.

44 45 dos algarves
Estimação de Modelos Lineares Gerais Mistos utilizando o SAS®

Para além destes métodos, têm Em geral, a matriz de variâncias e guinte: dado o vector de dados y, como
sido utilizados no passado recente covariâncias de y é uma função linear é que se pode predizer os valores dos
outros métodos para a estimação das de parâmetros desconhecidos a serem efeitos aleatórios que poderiam a ele
componentes de variância no contexto estimados. Assim, quanto mais ade- estar associados, ou seja, qual é “um”
do MLGM. Destaca-se o método de quada for a matriz G, escolhida a priori, estimador da média condicional E(u|y)
ajustamento de constantes (Hender- mais os resultados das estimativas de ? No caso do MLGM (1) tem-se que
son, 1953; Fuller e Battese, 1973). β e u se aproximarão de soluções BLUE o melhor preditor linear de u sob a
Existe, no entanto, evidência empí- (Best Linear Unbiased Estimator) e normalidade é dado por:
~
rica (Swallow e Monaham, 1984) que BLUP (Best Linear Unbiased Predictor), U=E(u|y)=GZ' V-1(y-Xβ). (4)
favorece a utilização dos métodos de respectivamente. Combinando os conceitos de
verosimilhança. O principal obstáculo predição e de melhor estimador linear
à sua utilização reside no grande peso Estimação dos efeitos fixos não enviesado, tem-se que o melhor
computacional que poderá impedir a Na análise do MLGM tem-se, em ge- preditor linear não enviesado, ou seja,
convergência ao trabalhar com conjun- ral, interesse na estimação e testes de o BLUP de u, é dado por:
~ ^
tos de dados de grande dimensão. hipóteses dos efeitos fixos. Entretan- u=GZ' V-1(y-Xβ). (5)
Este trabalho tem como objectivos to, para a estimativa de uma função Quando os parâmetros de θ são
^
apresentar métodos de estimação das estimável dos parâmetros de efeitos conhecidos, β é o melhor estimador
componentes de variância disponíveis fixos é necessário o conhecimento linear centrado de β e û é o melhor
no procedimento “proc mixed” do das estimativas das componentes de preditor linear centrado de u (a este
sistema computacional SAS versão 9.0 variância. Assim, as estimativas dos respeito ver Searle, 1971; Harville,
e ilustrar a utilização desse procedi- parâmetros de efeitos fixos dependem 1990; Robinson, 1991, McLean, Sanders
mento na estimação de MLGM com dos métodos utilizados na obtenção e Stroup, 1991). Quando as componen-
dois factores desbalanceados. das estimativas das componentes tes de variância são conhecidas, o
de variância. O Método dos Mínimos cálculo do BLUP de u não apresenta
METODOLOGIA Quadrados Generalizados (MMQG), dificuldades e pode ser obtido através
que minimiza , das conhecidas equações normais
Considerações iniciais (y-Xβ)'V-1 (y-Xβ) fornece o sistema (Henderson, 1984):
Neste estudo adopta-se a forma de equações normais generalizadas . X'X' X'Y β X'y K'y~N(φ,K
matricial para apresentar o MLGM, X'V-1 Xβ=X'V-1y Assim, para o Z'XZ'Z+σ2G -1 u Z'y . (6)
descrita em Searle (1987), Searle et al. modelo (1) tem-se que o BLUE de β é Resolvendo-se esse sistema de
(1992), Littell et al. (2006), entre outros: dado por: equações, obtêm-se as soluções
~
y = Xβ + Zu + ε, (1) β(θ)=(X'V-1(θ)X) - X'V-1(θ)y, (2) para os efeitos fixos β , e as predições
~
onde y é o vector das observações onde θ é um vector de parâmetros for- para os efeitos aleatórios, u. Para o
da variável dependente de dimensão mado pelas componentes de variância desenvolvimento precedente, assume-
(nx1); X é a matriz não estocástica de e (X'V-1X) - é uma qualquer matriz in- se que V é conhecida. Quando não é
n valores de p variáveis explicativas, versa generalizada de X'V-1X (Searle, esse o caso, então essas variâncias
de dimensão (nxp); β é o vector dos 1971). Desse modo, as componentes devem ser estimadas utilizando-se um
efeitos fixos, desconhecido, de dimen- de variância são consideradas nas esti- dos métodos disponíveis na literatura,
são (px1); Z é a matriz de desenho mativas dos efeitos fixos. Contudo, nas como por exemplo o método da ML ou
^
dos efeitos aleatórios, conhecida, de aplicações práticas, as componentes da REML. Então, substituindo V por V,
dimensão (nxq); u é o vector de efeitos de variância são desconhecidas. Nes- tem-se que as soluções das equações
aleatórios, desconhecido, de dimensão ses casos, uma estratégia interessante normais são dadas por:
^ ^ ^
(qx1) e ε é o vector de erros aleatórios e conveniente consiste em obter esti- β (X'V-1) -X'V-1y
~ ^ ^ -1 ^
não observáveis, de dimensão (nx1). mativas das componentes de variân- u GZ'V (y-X β) . (7)
Assim, para o modelo misto (1), as- cia, as quais são utilizadas em vez das Assim, utilizando-se a expres-
sumindo que os efeitos aleatórios u e componentes em V. Substituindo θ por são (7) obtém-se as estimativas dos
ε têm distribuição normal, com média θ na expressão (2) tem-se que: efeitos fixos e as predições dos efeitos
^ ^ ^ ^ ~ ~
zero, e matrizes de variâncias e cova- β(θ)=(X'V-1 (θ) X) - X'V-1 (θ) y . (3) aleatórios, β e u, respectivamente. Um
riâncias G e R = σ 2 I respectivamente, aspecto interessante das equações
o vector y terá distribuição normal mul- Predição dos efeitos aleatórios normais é que elas podem ser utiliza-
tivariada, com média Xβ e matriz de No MLGM (1) o vector u é um vector das em procedimentos iterativos para
variâncias e covariâncias V = ZGZ + σ 2 I, de variáveis aleatórias. Uma questão os cálculos das estimativas ML e REML
ou seja, y ~ N (Xβ,V). que se coloca frequentemente é a se- das componentes de variância. Alguns
detalhes do relacionamento entre A expressão (12) é a função ob- verosimilhança de cada parte.
essas equações e as estimativas ML jectivo para a ML utilizada pelo “proc O método REML tem sido conside-
e REML são apresentados em Harville mixed” do SAS. Minimizando-se essa rado o método preferido para estimar
(1977) e Searle et al. (1992). função sobre todos os parâmetros componentes de variância de dados
desconhecidos, obtém-se um sistema desbalanceados (Harville, 1977; Hen-
Estimação das componentes de equações cuja solução fornece as derson, 1984; Searle et al., 1992, entre
de variância estimativas ML. Essas equações são outros). As razões para essa preferên-
Para a obtenção do BLUE de β e do não lineares e são resolvidas numeri- cia são justificadas pelas propriedades
BLUP de u, exige-se o conhecimento camente, em geral por processos itera- desses estimadores. O método REML
das estimativas dos componentes de tivos como o algoritmo de Newton-Ra- supõe a normalidade dos dados, é
variância. Um problema relacionado phson. O processo é repetido até que iterativo e fornece sempre estimati-
com a estimação das componentes de o critério de convergência adoptado vas não negativas das componentes
variância para dados desbalanceados seja satisfeito. Assim, o método da de variância, como o método ML. No
assenta na dificuldade de escolher um ML supõe normalidade dos dados, é entanto, considera a perda de graus
método de estimação entre os muitos iterativo e fornece sempre estimativas de liberdade devido aos efeitos fixos,
métodos de estimação disponíveis. não negativas de componentes de fornecendo estimadores não enviesa-
Apresentam-se de seguida alguns mé- variância, mas estas são enviesadas, dos e de variância mínima para dados
todos de estimação das componentes pois o método não considera a perda balanceados. A principal diferença
de variância disponíveis no procedi- de graus de liberdade resultante da entre os métodos ML e REML é que
mento “proc mixed” do SAS: ML, REML, estimação dos efeitos fixos do modelo. o ML usa a função de verosimilhança
MIVQUE0. de K'y ou o logaritmo desta função,
Método da Máxima Verosimilhança enquanto o REML adopta a função de
Método da Máxima Verosimilhança Restrita (REML) verosimilhança de , o qual é um vector
(ML) Patterson e Thompson (1971) propu- de combinações lineares das observa-
Hartley e Rao (1967) aplicaram o seram uma modificação do método da ções (com média nula), que representa
método da ML ao MLGM. Este método ML para MLGM. Os estimadores REML efectivamente as observações ajusta-
consiste em maximizar a função de maximizam a função de verosimi- das para os efeitos fixos.
K'VK) verosimilhança, em relação aos efeitos lhança de um vector de combinações
fixos e às componentes de variância. lineares das observações que são Método de Estimação Quadrática
Assim, para o MLGM (1), assumindo invariantes a Xβ. Seja K'y esse vector. Não Enviesada de Variância Míni-
y ~ N (Xβ,V) com V=ZGZ'+σ2 I, a função Então K'y=K'Xβ+K'Zu+K'ε é invariante ma (MIVQUE)
de verosimilhança é dada por: a Xβ se e somente se K'X=φ . Com Rao (1971; 1972) propôs um método
n 1 y~N(Xβ,V), tem-se que para K'X=φ de estimação que é derivado de modo
L = (2π) 2 V 2 exp - 1
- -
(y-x β)'V-1 (y-x β)
2 , , K'y~N(φ,K'VK). As equações REML que o estimador seja uma forma
(8) também podem ser deduzidas das quadrática das observações, não
onde |V| é o determinante de V. O equações ML substituindo-se: y por enviesado e de variância mínima. O
logaritmo da função de verosimilhança K'y, X por K'X=0, Z por K'Z e V por K'VK. seu desenvolvimento envolve álgebra
é dado por: O procedimento “proc mixed” do SAS extensiva e o seu conceito utiliza
-2 logL= nlog(2π)+log V +(y-Xa)'V
^ -1
(y-X a^ ), (9) implementa o método REML cons- valores escolhidos, a priori, para as
O “proc mixed” implementa o método truindo a função -2 log da função de componentes de variância a estimar.
ML através da construção de uma verosimilhança restrita, dada por: Assim, diferentes valores a priori po-
função objectivo para ML minimizando ~ ~
-2logL R=(n-k)log(2π)+log|V|+(y-Xβ)'V-1(y-Xβ)+log|X'V-1X| dem levar a diferentes estimativas para
-2l, ou seja, minimizando: , (13) um mesmo conjunto de dados. Obtém-
-2 logL= nlog(2π)+log V +(y-X β)'V-1 (y-X β) onde k é a característica da matriz X e se portanto “um” estimador MIVQUE e
~ ~ ~
. (10) β=(X'V-1X) -X'V-1y, com e a repre- não “o” estimador MIVQUE.
Minimizando a expressão (10) relati- sentar as estimativas REML de β e V, Swallow e Monahan (1984) utiliza-
vamente a β obtém-se: respectivamente. ram o procedimento MIVQUE com a
~ ~ ~
β=(X'V-1X) -X'V-1y , (11) No método REML a função de vero- hipótese a priori de que a matriz de
~ ~
onde β e V representam as estima- similhança é dividida em duas partes variâncias e covariâncias é a matriz
tivas ML de β e V, respectivamente. independentes, uma referente aos identidade, MIVQUE0.
~
Substituindo β na expressão (10), efeitos fixos e outra aos aleatórios, de Sob normalidade, a estimação
tem-se que: maneira que a função de verosimilhan- das componentes de variância pelo
~ ~ ~ ~
-2logL nlog(2π)+log V +(y-x β)'V-1 (y-x β) . (12) ça é dada pela soma das funções de método MIVQUE0 é feita com base na

46 47 dos algarves
Estimação de Modelos Lineares Gerais Mistos utilizando o SAS®

Factor A
Factor B = Local de residência bém as suas variâncias e covariâncias.
Género Para além disso, este procedimento
Urbano (j=1) Semiurbano (j=2) Rural (j=3)
permite uma especificação geral da
176 153 207 matriz de variâncias e covariâncias dos
erros e que as componentes de erro
229 173 177
Masculino sejam correlacionados e oferece, ain-
197 189 185
(i=1) da, várias opções para a estrutura de
212 195 220
variâncias e covariâncias dos efeitos
190 - - aleatórios, sendo que essas podem ser
235 220 230
estimadas, por exemplo, através dos
métodos MIVQUE0, ML e REML.
266 252 249
Feminino
280 - 199
(i=2) ESTUDO EMPÍRICO
293 - -

- - - Em seguida, apresenta-se uma

aplicação prática com o objectivo de
tabela 1: Valores dos níveis de colesterol de 22 pacientes com diagnóstico clínico de acidente vascular ilustrar a utilização do procedimento
cerebral isquémico permanente
“proc mixed” no ajuste de modelos
mistos desbalanceados com dois fac-
tores (A fixo e B aleatório) e interacção.
Os dados apresentados na tabela 1,
referem-se aos valores dos níveis de
colesterol de 22 pacientes com diag-
nóstico clínico de acidente vascular
cerebral isquémico permanente, com
idade superior ou igual a 60 anos, ob-
servados no Hospital Distrital de Faro e
classificados de acordo com o género
e o local de residência.
O modelo utilizado para descrever
fig 1: Código SAS necessário para ajustar o modelo (15) aos dados da tabela 1
os dados da tabela 1 é o modelo misto
desbalanceado com dois factores (gé-
equação: Neste estudo, decidiu-se adoptar nero fixo e local aleatório) e interacção,
^ ^
{tr(PV i PV i)}S={SPV i Py i}, (14) R=σ 2I e as seguintes estruturas de caracterizado por:
^
onde V é o vector de soluções das G: componentes de variância (VC), Y ijk=μ+α i+β+Y j+ε ijk , com i=1, 2; j=1,
componentes de variância diagonal (TOEP(1)), simetria composta 2, 3 e k=1, 2, ...,nij (15)
e P=I-X(X'X) -1X'. (diagonal mais covariância comum: CS) onde Y ijk é o nível de colesterol do
e Huynh-Feldt (HF). k-ésimo indivíduo do j-ésimo local e
Estruturas gerais de covariância do género i; μ é a média global; α i é o
Conforme referido acima, a análise Procedimento “proc mixed” do SAS efeito do género;β j é o efeito do local
de modelos mistos envolve duas par- O “proc mixed” é o procedimento com β j~N(0;σβ2) e independentes; Y ij
tes: a análise da parte fixa e da parte do SAS apropriado para a análise de é o efeito cruzado do local e género,
aleatória. Tanto a estimação dos efei- modelos mistos desbalanceados, pois com Y ij~N(0;σ y2) e independentes; ε ijk é
tos fixos como a predição dos efeitos distingue claramente os efeitos fixos o erro aleatório, com ε ijk ~N(0;σ 2) e in-
aleatórios depende da estimação das dos efeitos aleatórios (Littell et al., dependentes. Admite-se também que ,
componentes de variância. A estima- 2006). Este procedimento utilizado β j, Y ij e ε ijk são independentes. Assim:
ção dessas componentes depende da para ajuste de MLGM permite uma σβ2Ij φ
estrutura da matriz G e do método de especificação geral da matriz de vari- y~N(Xβ,ZGZ' +σ 2I) onde φ σ Y2IG .
estimação utilizado. Várias estruturas âncias e covariâncias e ajusta o MLGM Na figura 1 são apresentados os
de covariância podem ser especifica- através do método dos MMQG. programas utilizando o “proc mixed”
das para a matriz G (a este respeito O “proc mixed” ajusta o MLGM (1) do SAS para ajustar os dados da tabela
ver Searle et al., 1992; Wolfinger, 1993, com a flexibilidade de modelar não so- 1. Observa-se que os efeitos fixos
1996; Littell et al., 2006; entre outros). mente as médias dos dados, mas tam- são especificados no “model”, e os
aleatórios no “random”. A estrutura de dimento é VC. As outras estruturas de para os efeitos fixos. Na tabela 2 são
G é definida no “random”, por meio da G consideradas neste trabalho são: CS, apresentadas algumas informações
opção “type”. TOEP(1) e HF. sobre o modelo misto ajustado pelo
No “proc mixed” o método REML é Com o “proc mixed” estimam-se “proc mixed” do SAS.
o método de estimação utilizado por as componentes de variância para os Na figura 2 são apresentados os
resultados obtidos por meio do “proc
Descrição Interpretação mixed” utilizando a estrutura de
componentes de variância para G e
-2 vezes o valor máximo do logaritmo neperiano o método REML para estimação das
-2 Log verosimilhança restrita
da verosimilhança restrita (-2l). componentes de variância. Observa-se
que o processo numérico para obter as
O critério AIC pode ser usado para comparar modelos
com os mesmos efeitos fixos, mas diferentes estruturas estimativas REML convergiu na terceira
Critério de Informação
de variância. O modelo com menor AIC é considerado o iteração, fornecendo as estimativas
de Akaike (AIC)
melhor. AIC=-2(l-q), onde q é o número de parâmetros de
covariância existentes em G e R. das componentes de variância.
Assim, as estimativas pelo método
O modelo com menor AICC é considerado o melhor.
Critério de Informação AICC= -2l+q[ln(n*)+1), onde n*=n para ML e n*=n-p
REML, quando G=VC são as seguintes:
Consistente de Akaike (AICC) para REML, q é o número de parâmetros de covariância σ^ 2local=118,05 , σ^ género*local=80,93 e
e p a ordem de X.
σ^ 2=469,81 . Portanto, a estimativa de
O modelo com menor BIC é considerado o melhor.
G é dada por:
Critério Bayesiano
BIC=-2l+qln(n*), onde n*=n para ML e n*=n-p para REML, q é 118,05I 3 φ
de Schwarz (BIC)
o número de parâmetros de covariância e p a ordem de X. φ 80,93I 6
.As funções estimáveis dos tipos I
tabela 2: Algumas informações sobre o ajuste do MLGM fornecidas pelo “proc mixed”
e III são iguais (Iemma, 1997), e assim,
a hipótese que está sendo testada
para o factor fixo, sexo, é dada por H 0
: α1-α 2=0. Observa-se na figura 2, que
foram estimados três componentes
de variância. Os resultados obtidos
por meio do “proc mixed” utilizando
as outras estruturas de G e os outros
métodos são análogos aos da figura 2
e não são apresentados neste artigo.
Segundo Wolfinger (1993) um dos
procedimentos utilizado na selecção
da estrutura de variâncias e covariân-
cias é o critério AIC, no qual menores
valores sugerem uma estrutura melhor.
Os resultados do critério AIC e dos
testes de hipóteses para o factor de
efeitos fixos, o género, de acordo com
as estruturas adoptadas para a matriz
G e os métodos de estimação utiliza-
dos, estão resumidos na tabela 3.
Quando se comparam as estruturas
fig 2: Resultados obtidos no SAS quando se ajusta o modelo (15) utilizando o método REML, de G, observa-se que para os três méto-
a opção E3 e G=VC
dos a “melhor”, no sentido de menor
valor AIC, é a TOEP(1) e a “pior” é a es-
defeito para se estimar as componen- efeitos aleatórios do modelo de acordo trutura HF. No entanto, a escolha da es-
tes de variância. No “proc mixed” é com o método especificado, bem trutura de G mais apropriada, não deve
possível especificar várias estruturas como as funções estimáveis dos tipos I ser exclusivamente baseada nestes
para a matriz de variâncias e covariân- e III conforme as opções E e E3 especi- critérios, devem-se também e principal-
cias dos efeitos aleatórios. A estrutura ficadas no “model” e o teste F usando mente considerar a natureza dos dados
de G utilizada por defeito neste proce- as somas de quadrados dos tipos I e III e a experiência do investigador.

48 49 dos algarves
Estimação de Modelos Lineares Gerais Mistos utilizando o SAS®

Valor do REML, o teste F foi significativo para

Método Estrutura de G F tipo III Pr > F
AIC
a estrutura de G=VC, e não signifi-
VC 194,0 19,37 0,0479 cativo para as demais estruturas.

CS 194,0 17,87 0,0517

REML CONCLUSÕES
TOEP(1) 192,0 17,87 0,0517

HF 210,0 17,87 0,0517 O SAS apresenta grande flexibilida-

VC 210,5 30,35 0,0314 de no ajuste de MLGM, destacando-se
a excelente performance do procedi-
CS (*) (*) (*)
ML mento “proc mixed”.
TOEP(1) 208,6 23,76 0,0396
O “proc mixed” é o procedimento
HF (*) (*) (*)
do SAS apropriado para análise de mo-
VC 194,0 22,69 0,0414 delos mistos, pois permite uma espe-
CS 194,0 17,33 0,0531
cificação geral da matriz de variâncias
MIVQUE0 e covariâncias dos efeitos aleatórios,
TOEP(1) 192,0 17,33 0,0531
G, e dos resíduos. A estrutura de G é
HF 218,5 1,00 0,4229
definida na opção “type” da declaração
(*) O Processo numérico para obter as estimativas ML não convergiu. “random”. A “melhor” estrutura de G,
de entre as utilizadas, no sentido de
tabela 3: Resultados do AIC e dos testes para o factor de efeitos fixos, obtidos pelo “proc mixed”
maior valor AIC, foi G=TOEP(1), para os
três métodos de estimação: MIVQUE0,
O critério AIC não é adequado para dados desbalanceados. ML e REML.
comparar os métodos: MIVQUE0, ML Os testes de hipóteses sobre os O nível nominal dos testes de
e REML, e, a menos que se conheça a efeitos fixos dependem da estrutura hipóteses do tipo III para o factor de
matriz de variâncias e covariâncias da da matriz G e do método de estima- efeitos fixos, género, foram semelhan-
população, torna-se pouco confortá- ção utilizado. Comparando-se os tes quando G=VC. No que se refere
vel para o investigador afirmar qual é testes F, ao nível de significância de às demais estruturas utilizadas neste
o melhor método. Uma comparação 5%, de acordo com as estruturas de estudo, apenas a estrutura G=HF alte-
analítica torna-se viável para dados G, para cada método separadamen- rou sensivelmente o nível nominal, em
balanceados e mesmo assim deve ser te, tem-se: para o MIVQUE0, o teste relação às demais.
feita com cautela, considerando-se F foi significativo para G=VC, sendo
cada modelo em particular. Conforme a estrutura G=HF a mais discrepan-
visto anteriormente, o método REML te de todas; para o ML, o teste F 1 Investigadora do Centro de Estudos e
tem sido considerado o preferido para foi significativo para as estruturas Investigação em Saúde da Universidade de
estimar componentes de variância de de G iguais a VC e TOEP(1); para o Coimbra (CEISUC)

Referências Bibliográficas

GILMOUR, A.R.; THOMPSON, R. e CULLIS, B.R. (1995), «Average information REML:

an efficient algorithm for variance parameter estimation in linear mixed
models», in Biometrics, vol.51, 1440-1450.
FULLER, W.A., e BATTESE, G.E. (1973), «Transformations for estimation of linear
models with nested-error structure», in Journal of the American Statistical
Association, vol. 68, 626-632.
HARTLEY, H.O. e RAO, J.N.K. (1967), «Maximum likelihood estimation for the mixed
analysis of variance model», in Biometrika, vol. 54, 93-108.
HARVILLE, D.A. (1977), «Maximum-likelihood approaches to variances component
estimation and to related problems», in Journal of the American Statistical
Association, vol.72, 320-340.
HARVILLE, D.A. (1990), «BLUP (Best linear unbiased prediction), and beyond», in
Advances in statistical methods for genetic improvement of lifestock, Springer-
Verlag, 239-276.
HENDERSON, C.R. (1953), «Estimation of variance and covariance components», in
Biometrics, vol. 9, 226-252.
HENDERSON, C.R. (1984), Applications of linear models in animal breeding,
University of Guelph, Ontario.
IEMMA, A.F. (1997), Hypothèses statistiques et fonctions estimables du logiciel
SAS, Gembloux.
LITTELL, R.C.; MILLIKEN, G.A.; STROUP, W.W.; WOLFINGER, R.D. e SCHABENBERGER,
O. (2006), SAS for mixed models, SAS Institute Inc., Cary.
McLEAN, R.A.; SANDERS, W.L. e STROUP, W.W. (1991), «A unified approach to mixed
linear models», in The American Statistician, vol. 45, 54-64.
PATTERSON, H.D. e THOMPSON, R. (1971), «Recovery of inter-block information
when blocks sizes are unequal», in Biometrika, vol. 58, 545-554.
RAO, C.R. (1971), «Minimum variance quadratic unbiased estimation of variance
components», in Journal of Multivariate Analysis, vol. 1, 445-456.
RAO, C.R. (1972), «Estimation of variance and covariance components in linear
models», in Journal of the American Statistical Association, vol. 67, 112-115.
RICHARDSON, A.M. e WELSH, A.H. (1995), «Robust restricted maximum likelihood
in mixed linear models», in Biometrics, vol. 51, 1429-1439.
ROBINSON, G.K. (1991), «That BLUP is a good thing: the estimation of random
effects», in Statistical Science, vol. 1, 15-51.
SCHEFFÉ, H. (1959), The analysis of variance, John Wiley & Sons, New York.
SEARLE, S.R. (1971), Linear models, John Wiley & Sons, New York.
SEARLE, S.R. (1987), Linear models for unbalanced data, John Wiley & Sons, New
York.
SEARLE, S.R.; CASELLA, G. e McCULLOCH, C. (1992), Variance components, John
Wiley & Sons, New York.
SWALLOW, W.H. e MONAHAN, J.F. (1984), «Monte Carlo comparison of ANOVA,
MINQUE, REML, and Ml estimators of variance components», in Technometrics,
vol. 26, 47-57.
WOLFINGER, R.D. (1993), «Covariance structure selection in general mixed
models», in Communications in statistics simulation and computation, vol. 22,
n.º 4: 1079-1106.
WOLFINGER, R.D. (1996), «Heterogeneous variance-covariance structures for
repeated measures», in Journal of Agricultural, Biological and Environmental
Statistics, vol. 1, n.º 2, 205-230.

50 51 dos algarves