0% acharam este documento útil (0 voto)
121 visualizações7 páginas

Apostila - Proc Mixed SAS PDF

Enviado por

Flávio Menezes
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd
0% acharam este documento útil (0 voto)
121 visualizações7 páginas

Apostila - Proc Mixed SAS PDF

Enviado por

Flávio Menezes
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd
Você está na página 1/ 7

Estimação de Modelos Lineares

Gerais Mistos utilizando o SAS®

O Modelo Linear Geral Misto (MLGM) enquadra-se numa classe


de modelos que tem sido tradicionalmente analisada através
de procedimentos de análise de variância. Nos MLGM exis-
tem três aspectos fundamentais: estimação e significância
dos efeitos fixos, predição dos efeitos aleatórios e estimação
das componentes de variância. Na análise de MLGM desbal-
anceados, a estimação das componentes de variância tem
importância extrema e depende da estrutura de covariância
e dos métodos de estimação utilizados. Este artigo pretende
apresentar os principais métodos de estimação do MLGM com
estruturas gerais de covariância dos efeitos aleatórios, dis-
poníveis no procedimento “proc mixed” do Statistical Analysis
System (SAS).

Luís Pereira – ESGHT


Lara Ferreira – ESGHT1

INTRODUÇÃO efeitos aleatórios como a estimação Patterson e Thompson (1971). Todos


dos efeitos fixos dependem da estima- estes métodos estão disponíveis no
Os MLGM são utilizados para ção das componentes de variância. procedimento “proc mixed” do SAS.
descrever um conjunto de dados cuja Segundo Scheffé (1959), o MLGM foi Searle et al. (1992) apresentaram
estrutura de tratamentos envolve amplamente estudado por Fisher em uma ampla discussão sobre estimação
alguns factores que são fixos e outros 1918, com grande repercussão nos es- de componentes de variância e análise
que são aleatórios, ou seja, modelos tudos de genética quantitativa. Tal mo- de modelos mistos, ilustrando-os por
lineares que contêm efeitos fixos e delo foi denominado pelo autor como meio de exemplos. Richardson e Welsh
aleatórios, independentemente da modelo de componentes de variância. (1995) apresentaram duas definições
média e do erro. Consequentemente, a Diversos métodos têm sido pro- de máxima verosimilhança robusta
análise de um modelo misto envol- postos para estimar as componentes e máxima verosimilhança restrita
ve duas partes: uma análise para a de variância, destacando-se o método robusta, e apresentaram também, por
parte aleatória e outra para a parte da máxima verosimilhança (Maximum meio de simulação, um estudo para
fixa. Nos MLGM a análise da parte Likelihood: ML) da autoria de a Hartley investigar as propriedades assimptó-
aleatória consiste na predição dos e Rao (1967), o método da estimação ticas e as vantagens de utilizar esses
efeitos aleatórios e na estimação das quadrática não enviesada de variância métodos robustos. Gilmour et al. (1995)
componentes de variância. A análise mínima (Minimum Variance Quadratic descreveram e aplicaram o algoritmo
da parte fixa consiste na estimação e Unbiased Estimation: MIVQUE) descrito Average Information (AI), na estimação
na realização de testes de hipóteses em Rao (1971) e o método da máxima de componentes de variância pelo
sobre funções estimáveis dos efeitos verosimilhança restrita (Restricted Ma- método da REML, em modelos mistos
fixos. Em geral, tanto a predição dos ximum Likelihood: REML) descrito por com erros correlacionados.

44 45 dos algarves
Estimação de Modelos Lineares Gerais Mistos utilizando o SAS®

Para além destes métodos, têm Em geral, a matriz de variâncias e guinte: dado o vector de dados y, como
sido utilizados no passado recente covariâncias de y é uma função linear é que se pode predizer os valores dos
outros métodos para a estimação das de parâmetros desconhecidos a serem efeitos aleatórios que poderiam a ele
componentes de variância no contexto estimados. Assim, quanto mais ade- estar associados, ou seja, qual é “um”
do MLGM. Destaca-se o método de quada for a matriz G, escolhida a priori, estimador da média condicional E(u|y)
ajustamento de constantes (Hender- mais os resultados das estimativas de ? No caso do MLGM (1) tem-se que
son, 1953; Fuller e Battese, 1973). β e u se aproximarão de soluções BLUE o melhor preditor linear de u sob a
Existe, no entanto, evidência empí- (Best Linear Unbiased Estimator) e normalidade é dado por:
~
rica (Swallow e Monaham, 1984) que BLUP (Best Linear Unbiased Predictor), U=E(u|y)=GZ' V-1(y-Xβ). (4)
favorece a utilização dos métodos de respectivamente. Combinando os conceitos de
verosimilhança. O principal obstáculo predição e de melhor estimador linear
à sua utilização reside no grande peso Estimação dos efeitos fixos não enviesado, tem-se que o melhor
computacional que poderá impedir a Na análise do MLGM tem-se, em ge- preditor linear não enviesado, ou seja,
convergência ao trabalhar com conjun- ral, interesse na estimação e testes de o BLUP de u, é dado por:
~ ^
tos de dados de grande dimensão. hipóteses dos efeitos fixos. Entretan- u=GZ' V-1(y-Xβ). (5)
Este trabalho tem como objectivos to, para a estimativa de uma função Quando os parâmetros de θ são
^
apresentar métodos de estimação das estimável dos parâmetros de efeitos conhecidos, β é o melhor estimador
componentes de variância disponíveis fixos é necessário o conhecimento linear centrado de β e û é o melhor
no procedimento “proc mixed” do das estimativas das componentes de preditor linear centrado de u (a este
sistema computacional SAS versão 9.0 variância. Assim, as estimativas dos respeito ver Searle, 1971; Harville,
e ilustrar a utilização desse procedi- parâmetros de efeitos fixos dependem 1990; Robinson, 1991, McLean, Sanders
mento na estimação de MLGM com dos métodos utilizados na obtenção e Stroup, 1991). Quando as componen-
dois factores desbalanceados. das estimativas das componentes tes de variância são conhecidas, o
de variância. O Método dos Mínimos cálculo do BLUP de u não apresenta
METODOLOGIA Quadrados Generalizados (MMQG), dificuldades e pode ser obtido através
que minimiza , das conhecidas equações normais
Considerações iniciais (y-Xβ)'V-1 (y-Xβ) fornece o sistema (Henderson, 1984):
Neste estudo adopta-se a forma de equações normais generalizadas . X'X' X'Y β X'y K'y~N(φ,K
matricial para apresentar o MLGM, X'V-1 Xβ=X'V-1y Assim, para o Z'XZ'Z+σ2G -1 u Z'y . (6)
descrita em Searle (1987), Searle et al. modelo (1) tem-se que o BLUE de β é Resolvendo-se esse sistema de
(1992), Littell et al. (2006), entre outros: dado por: equações, obtêm-se as soluções
~
y = Xβ + Zu + ε, (1) β(θ)=(X'V-1(θ)X) - X'V-1(θ)y, (2) para os efeitos fixos β , e as predições
~
onde y é o vector das observações onde θ é um vector de parâmetros for- para os efeitos aleatórios, u. Para o
da variável dependente de dimensão mado pelas componentes de variância desenvolvimento precedente, assume-
(nx1); X é a matriz não estocástica de e (X'V-1X) - é uma qualquer matriz in- se que V é conhecida. Quando não é
n valores de p variáveis explicativas, versa generalizada de X'V-1X (Searle, esse o caso, então essas variâncias
de dimensão (nxp); β é o vector dos 1971). Desse modo, as componentes devem ser estimadas utilizando-se um
efeitos fixos, desconhecido, de dimen- de variância são consideradas nas esti- dos métodos disponíveis na literatura,
são (px1); Z é a matriz de desenho mativas dos efeitos fixos. Contudo, nas como por exemplo o método da ML ou
^
dos efeitos aleatórios, conhecida, de aplicações práticas, as componentes da REML. Então, substituindo V por V,
dimensão (nxq); u é o vector de efeitos de variância são desconhecidas. Nes- tem-se que as soluções das equações
aleatórios, desconhecido, de dimensão ses casos, uma estratégia interessante normais são dadas por:
^ ^ ^
(qx1) e ε é o vector de erros aleatórios e conveniente consiste em obter esti- β (X'V-1) -X'V-1y
~ ^ ^ -1 ^
não observáveis, de dimensão (nx1). mativas das componentes de variân- u GZ'V (y-X β) . (7)
Assim, para o modelo misto (1), as- cia, as quais são utilizadas em vez das Assim, utilizando-se a expres-
sumindo que os efeitos aleatórios u e componentes em V. Substituindo θ por são (7) obtém-se as estimativas dos
ε têm distribuição normal, com média θ na expressão (2) tem-se que: efeitos fixos e as predições dos efeitos
^ ^ ^ ^ ~ ~
zero, e matrizes de variâncias e cova- β(θ)=(X'V-1 (θ) X) - X'V-1 (θ) y . (3) aleatórios, β e u, respectivamente. Um
riâncias G e R = σ 2 I respectivamente, aspecto interessante das equações
o vector y terá distribuição normal mul- Predição dos efeitos aleatórios normais é que elas podem ser utiliza-
tivariada, com média Xβ e matriz de No MLGM (1) o vector u é um vector das em procedimentos iterativos para
variâncias e covariâncias V = ZGZ + σ 2 I, de variáveis aleatórias. Uma questão os cálculos das estimativas ML e REML
ou seja, y ~ N (Xβ,V). que se coloca frequentemente é a se- das componentes de variância. Alguns
detalhes do relacionamento entre A expressão (12) é a função ob- verosimilhança de cada parte.
essas equações e as estimativas ML jectivo para a ML utilizada pelo “proc O método REML tem sido conside-
e REML são apresentados em Harville mixed” do SAS. Minimizando-se essa rado o método preferido para estimar
(1977) e Searle et al. (1992). função sobre todos os parâmetros componentes de variância de dados
desconhecidos, obtém-se um sistema desbalanceados (Harville, 1977; Hen-
Estimação das componentes de equações cuja solução fornece as derson, 1984; Searle et al., 1992, entre
de variância estimativas ML. Essas equações são outros). As razões para essa preferên-
Para a obtenção do BLUE de β e do não lineares e são resolvidas numeri- cia são justificadas pelas propriedades
BLUP de u, exige-se o conhecimento camente, em geral por processos itera- desses estimadores. O método REML
das estimativas dos componentes de tivos como o algoritmo de Newton-Ra- supõe a normalidade dos dados, é
variância. Um problema relacionado phson. O processo é repetido até que iterativo e fornece sempre estimati-
com a estimação das componentes de o critério de convergência adoptado vas não negativas das componentes
variância para dados desbalanceados seja satisfeito. Assim, o método da de variância, como o método ML. No
assenta na dificuldade de escolher um ML supõe normalidade dos dados, é entanto, considera a perda de graus
método de estimação entre os muitos iterativo e fornece sempre estimativas de liberdade devido aos efeitos fixos,
métodos de estimação disponíveis. não negativas de componentes de fornecendo estimadores não enviesa-
Apresentam-se de seguida alguns mé- variância, mas estas são enviesadas, dos e de variância mínima para dados
todos de estimação das componentes pois o método não considera a perda balanceados. A principal diferença
de variância disponíveis no procedi- de graus de liberdade resultante da entre os métodos ML e REML é que
mento “proc mixed” do SAS: ML, REML, estimação dos efeitos fixos do modelo. o ML usa a função de verosimilhança
MIVQUE0. de K'y ou o logaritmo desta função,
Método da Máxima Verosimilhança enquanto o REML adopta a função de
Método da Máxima Verosimilhança Restrita (REML) verosimilhança de , o qual é um vector
(ML) Patterson e Thompson (1971) propu- de combinações lineares das observa-
Hartley e Rao (1967) aplicaram o seram uma modificação do método da ções (com média nula), que representa
método da ML ao MLGM. Este método ML para MLGM. Os estimadores REML efectivamente as observações ajusta-
consiste em maximizar a função de maximizam a função de verosimi- das para os efeitos fixos.
K'VK) verosimilhança, em relação aos efeitos lhança de um vector de combinações
fixos e às componentes de variância. lineares das observações que são Método de Estimação Quadrática
Assim, para o MLGM (1), assumindo invariantes a Xβ. Seja K'y esse vector. Não Enviesada de Variância Míni-
y ~ N (Xβ,V) com V=ZGZ'+σ2 I, a função Então K'y=K'Xβ+K'Zu+K'ε é invariante ma (MIVQUE)
de verosimilhança é dada por: a Xβ se e somente se K'X=φ . Com Rao (1971; 1972) propôs um método
n 1 y~N(Xβ,V), tem-se que para K'X=φ de estimação que é derivado de modo
L = (2π) 2 V 2 exp - 1
- -
(y-x β)'V-1 (y-x β)
2 , , K'y~N(φ,K'VK). As equações REML que o estimador seja uma forma
(8) também podem ser deduzidas das quadrática das observações, não
onde |V| é o determinante de V. O equações ML substituindo-se: y por enviesado e de variância mínima. O
logaritmo da função de verosimilhança K'y, X por K'X=0, Z por K'Z e V por K'VK. seu desenvolvimento envolve álgebra
é dado por: O procedimento “proc mixed” do SAS extensiva e o seu conceito utiliza
-2 logL= nlog(2π)+log V +(y-Xa)'V
^ -1
(y-X a^ ), (9) implementa o método REML cons- valores escolhidos, a priori, para as
O “proc mixed” implementa o método truindo a função -2 log da função de componentes de variância a estimar.
ML através da construção de uma verosimilhança restrita, dada por: Assim, diferentes valores a priori po-
função objectivo para ML minimizando ~ ~
-2logL R=(n-k)log(2π)+log|V|+(y-Xβ)'V-1(y-Xβ)+log|X'V-1X| dem levar a diferentes estimativas para
-2l, ou seja, minimizando: , (13) um mesmo conjunto de dados. Obtém-
-2 logL= nlog(2π)+log V +(y-X β)'V-1 (y-X β) onde k é a característica da matriz X e se portanto “um” estimador MIVQUE e
~ ~ ~
. (10) β=(X'V-1X) -X'V-1y, com e a repre- não “o” estimador MIVQUE.
Minimizando a expressão (10) relati- sentar as estimativas REML de β e V, Swallow e Monahan (1984) utiliza-
vamente a β obtém-se: respectivamente. ram o procedimento MIVQUE com a
~ ~ ~
β=(X'V-1X) -X'V-1y , (11) No método REML a função de vero- hipótese a priori de que a matriz de
~ ~
onde β e V representam as estima- similhança é dividida em duas partes variâncias e covariâncias é a matriz
tivas ML de β e V, respectivamente. independentes, uma referente aos identidade, MIVQUE0.
~
Substituindo β na expressão (10), efeitos fixos e outra aos aleatórios, de Sob normalidade, a estimação
tem-se que: maneira que a função de verosimilhan- das componentes de variância pelo
~ ~ ~ ~
-2logL nlog(2π)+log V +(y-x β)'V-1 (y-x β) . (12) ça é dada pela soma das funções de método MIVQUE0 é feita com base na

46 47 dos algarves
Estimação de Modelos Lineares Gerais Mistos utilizando o SAS®

Factor A
Factor B = Local de residência bém as suas variâncias e covariâncias.
Género Para além disso, este procedimento
Urbano (j=1) Semiurbano (j=2) Rural (j=3)
permite uma especificação geral da
176 153 207 matriz de variâncias e covariâncias dos
erros e que as componentes de erro
229 173 177
Masculino sejam correlacionados e oferece, ain-
197 189 185
(i=1) da, várias opções para a estrutura de
212 195 220
variâncias e covariâncias dos efeitos
190 - - aleatórios, sendo que essas podem ser
235 220 230
estimadas, por exemplo, através dos
métodos MIVQUE0, ML e REML.
266 252 249
Feminino
280 - 199
(i=2) ESTUDO EMPÍRICO
293 - -

- - - Em seguida, apresenta-se uma


aplicação prática com o objectivo de
tabela 1: Valores dos níveis de colesterol de 22 pacientes com diagnóstico clínico de acidente vascular ilustrar a utilização do procedimento
cerebral isquémico permanente
“proc mixed” no ajuste de modelos
mistos desbalanceados com dois fac-
tores (A fixo e B aleatório) e interacção.
Os dados apresentados na tabela 1,
referem-se aos valores dos níveis de
colesterol de 22 pacientes com diag-
nóstico clínico de acidente vascular
cerebral isquémico permanente, com
idade superior ou igual a 60 anos, ob-
servados no Hospital Distrital de Faro e
classificados de acordo com o género
e o local de residência.
O modelo utilizado para descrever
fig 1: Código SAS necessário para ajustar o modelo (15) aos dados da tabela 1
os dados da tabela 1 é o modelo misto
desbalanceado com dois factores (gé-
equação: Neste estudo, decidiu-se adoptar nero fixo e local aleatório) e interacção,
^ ^
{tr(PV i PV i)}S={SPV i Py i}, (14) R=σ 2I e as seguintes estruturas de caracterizado por:
^
onde V é o vector de soluções das G: componentes de variância (VC), Y ijk=μ+α i+β+Y j+ε ijk , com i=1, 2; j=1,
componentes de variância diagonal (TOEP(1)), simetria composta 2, 3 e k=1, 2, ...,nij (15)
e P=I-X(X'X) -1X'. (diagonal mais covariância comum: CS) onde Y ijk é o nível de colesterol do
e Huynh-Feldt (HF). k-ésimo indivíduo do j-ésimo local e
Estruturas gerais de covariância do género i; μ é a média global; α i é o
Conforme referido acima, a análise Procedimento “proc mixed” do SAS efeito do género;β j é o efeito do local
de modelos mistos envolve duas par- O “proc mixed” é o procedimento com β j~N(0;σβ2) e independentes; Y ij
tes: a análise da parte fixa e da parte do SAS apropriado para a análise de é o efeito cruzado do local e género,
aleatória. Tanto a estimação dos efei- modelos mistos desbalanceados, pois com Y ij~N(0;σ y2) e independentes; ε ijk é
tos fixos como a predição dos efeitos distingue claramente os efeitos fixos o erro aleatório, com ε ijk ~N(0;σ 2) e in-
aleatórios depende da estimação das dos efeitos aleatórios (Littell et al., dependentes. Admite-se também que ,
componentes de variância. A estima- 2006). Este procedimento utilizado β j, Y ij e ε ijk são independentes. Assim:
ção dessas componentes depende da para ajuste de MLGM permite uma σβ2Ij φ
estrutura da matriz G e do método de especificação geral da matriz de vari- y~N(Xβ,ZGZ' +σ 2I) onde φ σ Y2IG .
estimação utilizado. Várias estruturas âncias e covariâncias e ajusta o MLGM Na figura 1 são apresentados os
de covariância podem ser especifica- através do método dos MMQG. programas utilizando o “proc mixed”
das para a matriz G (a este respeito O “proc mixed” ajusta o MLGM (1) do SAS para ajustar os dados da tabela
ver Searle et al., 1992; Wolfinger, 1993, com a flexibilidade de modelar não so- 1. Observa-se que os efeitos fixos
1996; Littell et al., 2006; entre outros). mente as médias dos dados, mas tam- são especificados no “model”, e os
aleatórios no “random”. A estrutura de dimento é VC. As outras estruturas de para os efeitos fixos. Na tabela 2 são
G é definida no “random”, por meio da G consideradas neste trabalho são: CS, apresentadas algumas informações
opção “type”. TOEP(1) e HF. sobre o modelo misto ajustado pelo
No “proc mixed” o método REML é Com o “proc mixed” estimam-se “proc mixed” do SAS.
o método de estimação utilizado por as componentes de variância para os Na figura 2 são apresentados os
resultados obtidos por meio do “proc
Descrição Interpretação mixed” utilizando a estrutura de
componentes de variância para G e
-2 vezes o valor máximo do logaritmo neperiano o método REML para estimação das
-2 Log verosimilhança restrita
da verosimilhança restrita (-2l). componentes de variância. Observa-se
que o processo numérico para obter as
O critério AIC pode ser usado para comparar modelos
com os mesmos efeitos fixos, mas diferentes estruturas estimativas REML convergiu na terceira
Critério de Informação
de variância. O modelo com menor AIC é considerado o iteração, fornecendo as estimativas
de Akaike (AIC)
melhor. AIC=-2(l-q), onde q é o número de parâmetros de
covariância existentes em G e R. das componentes de variância.
Assim, as estimativas pelo método
O modelo com menor AICC é considerado o melhor.
Critério de Informação AICC= -2l+q[ln(n*)+1), onde n*=n para ML e n*=n-p
REML, quando G=VC são as seguintes:
Consistente de Akaike (AICC) para REML, q é o número de parâmetros de covariância σ^ 2local=118,05 , σ^ género*local=80,93 e
e p a ordem de X.
σ^ 2=469,81 . Portanto, a estimativa de
O modelo com menor BIC é considerado o melhor.
G é dada por:
Critério Bayesiano
BIC=-2l+qln(n*), onde n*=n para ML e n*=n-p para REML, q é 118,05I 3 φ
de Schwarz (BIC)
o número de parâmetros de covariância e p a ordem de X. φ 80,93I 6
.As funções estimáveis dos tipos I
tabela 2: Algumas informações sobre o ajuste do MLGM fornecidas pelo “proc mixed”
e III são iguais (Iemma, 1997), e assim,
a hipótese que está sendo testada
para o factor fixo, sexo, é dada por H 0
: α1-α 2=0. Observa-se na figura 2, que
foram estimados três componentes
de variância. Os resultados obtidos
por meio do “proc mixed” utilizando
as outras estruturas de G e os outros
métodos são análogos aos da figura 2
e não são apresentados neste artigo.
Segundo Wolfinger (1993) um dos
procedimentos utilizado na selecção
da estrutura de variâncias e covariân-
cias é o critério AIC, no qual menores
valores sugerem uma estrutura melhor.
Os resultados do critério AIC e dos
testes de hipóteses para o factor de
efeitos fixos, o género, de acordo com
as estruturas adoptadas para a matriz
G e os métodos de estimação utiliza-
dos, estão resumidos na tabela 3.
Quando se comparam as estruturas
fig 2: Resultados obtidos no SAS quando se ajusta o modelo (15) utilizando o método REML, de G, observa-se que para os três méto-
a opção E3 e G=VC
dos a “melhor”, no sentido de menor
valor AIC, é a TOEP(1) e a “pior” é a es-
defeito para se estimar as componen- efeitos aleatórios do modelo de acordo trutura HF. No entanto, a escolha da es-
tes de variância. No “proc mixed” é com o método especificado, bem trutura de G mais apropriada, não deve
possível especificar várias estruturas como as funções estimáveis dos tipos I ser exclusivamente baseada nestes
para a matriz de variâncias e covariân- e III conforme as opções E e E3 especi- critérios, devem-se também e principal-
cias dos efeitos aleatórios. A estrutura ficadas no “model” e o teste F usando mente considerar a natureza dos dados
de G utilizada por defeito neste proce- as somas de quadrados dos tipos I e III e a experiência do investigador.

48 49 dos algarves
Estimação de Modelos Lineares Gerais Mistos utilizando o SAS®

Valor do REML, o teste F foi significativo para


Método Estrutura de G F tipo III Pr > F
AIC
a estrutura de G=VC, e não signifi-
VC 194,0 19,37 0,0479 cativo para as demais estruturas.

CS 194,0 17,87 0,0517


REML CONCLUSÕES
TOEP(1) 192,0 17,87 0,0517

HF 210,0 17,87 0,0517 O SAS apresenta grande flexibilida-


VC 210,5 30,35 0,0314 de no ajuste de MLGM, destacando-se
a excelente performance do procedi-
CS (*) (*) (*)
ML mento “proc mixed”.
TOEP(1) 208,6 23,76 0,0396
O “proc mixed” é o procedimento
HF (*) (*) (*)
do SAS apropriado para análise de mo-
VC 194,0 22,69 0,0414 delos mistos, pois permite uma espe-
CS 194,0 17,33 0,0531
cificação geral da matriz de variâncias
MIVQUE0 e covariâncias dos efeitos aleatórios,
TOEP(1) 192,0 17,33 0,0531
G, e dos resíduos. A estrutura de G é
HF 218,5 1,00 0,4229
definida na opção “type” da declaração
(*) O Processo numérico para obter as estimativas ML não convergiu. “random”. A “melhor” estrutura de G,
de entre as utilizadas, no sentido de
tabela 3: Resultados do AIC e dos testes para o factor de efeitos fixos, obtidos pelo “proc mixed”
maior valor AIC, foi G=TOEP(1), para os
três métodos de estimação: MIVQUE0,
O critério AIC não é adequado para dados desbalanceados. ML e REML.
comparar os métodos: MIVQUE0, ML Os testes de hipóteses sobre os O nível nominal dos testes de
e REML, e, a menos que se conheça a efeitos fixos dependem da estrutura hipóteses do tipo III para o factor de
matriz de variâncias e covariâncias da da matriz G e do método de estima- efeitos fixos, género, foram semelhan-
população, torna-se pouco confortá- ção utilizado. Comparando-se os tes quando G=VC. No que se refere
vel para o investigador afirmar qual é testes F, ao nível de significância de às demais estruturas utilizadas neste
o melhor método. Uma comparação 5%, de acordo com as estruturas de estudo, apenas a estrutura G=HF alte-
analítica torna-se viável para dados G, para cada método separadamen- rou sensivelmente o nível nominal, em
balanceados e mesmo assim deve ser te, tem-se: para o MIVQUE0, o teste relação às demais.
feita com cautela, considerando-se F foi significativo para G=VC, sendo
cada modelo em particular. Conforme a estrutura G=HF a mais discrepan-
visto anteriormente, o método REML te de todas; para o ML, o teste F 1 Investigadora do Centro de Estudos e
tem sido considerado o preferido para foi significativo para as estruturas Investigação em Saúde da Universidade de
estimar componentes de variância de de G iguais a VC e TOEP(1); para o Coimbra (CEISUC)

Referências Bibliográficas

GILMOUR, A.R.; THOMPSON, R. e CULLIS, B.R. (1995), «Average information REML:


an efficient algorithm for variance parameter estimation in linear mixed
models», in Biometrics, vol.51, 1440-1450.
FULLER, W.A., e BATTESE, G.E. (1973), «Transformations for estimation of linear
models with nested-error structure», in Journal of the American Statistical
Association, vol. 68, 626-632.
HARTLEY, H.O. e RAO, J.N.K. (1967), «Maximum likelihood estimation for the mixed
analysis of variance model», in Biometrika, vol. 54, 93-108.
HARVILLE, D.A. (1977), «Maximum-likelihood approaches to variances component
estimation and to related problems», in Journal of the American Statistical
Association, vol.72, 320-340.
HARVILLE, D.A. (1990), «BLUP (Best linear unbiased prediction), and beyond», in
Advances in statistical methods for genetic improvement of lifestock, Springer-
Verlag, 239-276.
HENDERSON, C.R. (1953), «Estimation of variance and covariance components», in
Biometrics, vol. 9, 226-252.
HENDERSON, C.R. (1984), Applications of linear models in animal breeding,
University of Guelph, Ontario.
IEMMA, A.F. (1997), Hypothèses statistiques et fonctions estimables du logiciel
SAS, Gembloux.
LITTELL, R.C.; MILLIKEN, G.A.; STROUP, W.W.; WOLFINGER, R.D. e SCHABENBERGER,
O. (2006), SAS for mixed models, SAS Institute Inc., Cary.
McLEAN, R.A.; SANDERS, W.L. e STROUP, W.W. (1991), «A unified approach to mixed
linear models», in The American Statistician, vol. 45, 54-64.
PATTERSON, H.D. e THOMPSON, R. (1971), «Recovery of inter-block information
when blocks sizes are unequal», in Biometrika, vol. 58, 545-554.
RAO, C.R. (1971), «Minimum variance quadratic unbiased estimation of variance
components», in Journal of Multivariate Analysis, vol. 1, 445-456.
RAO, C.R. (1972), «Estimation of variance and covariance components in linear
models», in Journal of the American Statistical Association, vol. 67, 112-115.
RICHARDSON, A.M. e WELSH, A.H. (1995), «Robust restricted maximum likelihood
in mixed linear models», in Biometrics, vol. 51, 1429-1439.
ROBINSON, G.K. (1991), «That BLUP is a good thing: the estimation of random
effects», in Statistical Science, vol. 1, 15-51.
SCHEFFÉ, H. (1959), The analysis of variance, John Wiley & Sons, New York.
SEARLE, S.R. (1971), Linear models, John Wiley & Sons, New York.
SEARLE, S.R. (1987), Linear models for unbalanced data, John Wiley & Sons, New
York.
SEARLE, S.R.; CASELLA, G. e McCULLOCH, C. (1992), Variance components, John
Wiley & Sons, New York.
SWALLOW, W.H. e MONAHAN, J.F. (1984), «Monte Carlo comparison of ANOVA,
MINQUE, REML, and Ml estimators of variance components», in Technometrics,
vol. 26, 47-57.
WOLFINGER, R.D. (1993), «Covariance structure selection in general mixed
models», in Communications in statistics simulation and computation, vol. 22,
n.º 4: 1079-1106.
WOLFINGER, R.D. (1996), «Heterogeneous variance-covariance structures for
repeated measures», in Journal of Agricultural, Biological and Environmental
Statistics, vol. 1, n.º 2, 205-230.

50 51 dos algarves

Você também pode gostar

pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy