Aplicação de métodos geoestatísticos para identificação de depe



Baixar 129.58 Kb.
Encontro02.07.2019
Tamanho129.58 Kb.

INTRODUÇÃO

Em ensaios florestais a determinação do espaçamento ótimo de plantio deve conter um número suficiente de indivíduos mensuráveis, implicando em grandes áreas para suas instalações. Dessa forma a instalação de experimentos tradicionais com repetição, aleatorização dos tratamentos, controle local e bordadura, têm restringido o número de espaçamentos testados nos ensaios de campo (STAPE, 1995).

Visando superar tais restrições, foram propostos na década de 60 alguns delineamentos alternativos, entre eles, os delineamentos sistemáticos de NELDER (1962). Esses delineamentos, inicialmente utilizados na área agrícola, foram usados na área florestal para estudos preliminares (FREEMAN, 1964; BLEASDALE, 1966; PANETSOS, 1980; HUXLEY, 1985; IMADA et al., 1997, HUMMEL, 2000; WAGHORN et al., 2007). Além de permitir avaliar um maior número de espaçamentos possíveis, os delineamentos sistemáticos também se destacam pela sua compacidade, necessitando de áreas experimentais menores que facilitam o manejo e abrangência.

No entanto, o arranjo sistemático não casualizado das plantas, não permite o uso das análises estatísticas convencionais para comparação dos tratamentos por ferir o princípio básico da casualização. A falta da casualização não garante a independência dos erros associados a cada unidade experimental, induzindo correlação entre as unidades experimentais. A análise usual de experimentos se baseia nos princípios de aleatorização para justificar as inferências estatísticas e, na ausência desta, não há como evitar que as condições ambientais induzam dependência entre as unidades mensuradas.

O efeito da dependência espacial em experimentos tem sido estudado por GRONDONA e CRESSIE (1991), CRESSIE (1993), VER HOEF e CRESSIE (1993). Esses estudos consideram a posição espacial das amostras, utilizando a modelagem geoestatística com estimadores de parâmetros como variograma seguido de mínimos quadrados generalizados (CRESSIE, 1993, VER HOEF e CRESSIE, 1993), máxima verossimilhança (CRESSIE, 1993; ZIMMERMAN e HARVILLE, 1991) e máxima verossimilhança restrita (CRESSIE, 1993).

Outro método de modelagem espacial aplicado em experimentos é dos Vizinhos-Próximos (PAPADAKIS, 1937; BARTLETT, 1978; BESAG e KEMPTON, 1986), que modela a dependência através da informação observada nas parcelas vizinhas com o objetivo de minimizar o erro experimental.

Em seus estudos, CRESSIE (1993) assegura que a detecção da estrutura de dependência espacial e o uso dessa informação na análise estatística garantem estimativas mais eficientes, e por outro lado, ignorar esse componente pode impedir que diferenças reais sejam detectadas.

Dessa forma, o objetivo desse estudo é verificar o comportamento entre modelos e métodos de estimação de parâmetros que consideram a presença da informação espacial na análise de dados experimentais na busca por mais eficiência na análise de dados que apresentem dependência espacial, através de um estudo de simulação.



MATERIAL E MÉTODOS

Delineamento sistemático tipo leque

Esse estudo utilizou-se as mesmas características experimentais baseado em um experimento de espaçamento de Eucalyptus dunnii em delineamento sistemático tipo leque, instalado conforme o modelo proposto por NELDER (1962) e denotado por 1a. A Figura 1 mostra o croqui do experimento que foi instalado com 10 tratamentos (arcos) e 36 repetições (raios) contando com bordadura interna com raio de 5,30m e com uma bordadura externa com raio de 43,60m (STAPE, 1995). Esse experimento foi analisado por STAPE (1995) no contexto da estatística clássica, comparando-se com os delineamentos aleatórios tradicionais e por ODA-SOUZA et al. (2009) no contexto de modelagem geoestatística.

(FIGURA 1)
Especificação dos modelos

Os modelos utilizados nesse trabalho foram:



  • Modelo Linear Gaussiano (MLG): O modelo linear gaussiano pode ser expresso da

seguinte forma matricial:

(1)

em que, Y = (y(x1),...,y(xn)) é o vetor dos valores da variável resposta, F é a matriz delineamento,  é o vetor das médias;  é o vetor dos erros independentes e normalmente distribuídos.



  • Modelo Geoestatístico (MG): A diferença entre o MLG e MG é que este é acrescido de um componente de erros aleatórios dependentes, cuja correlação é modelada como função da distância entre as observações. Dessa forma o modelo matricial é dado por:

(2)

em que S(x) é um processo estocástico gaussiano, com média zero, variância ² e função de correlação (u;) com argumento dado pela distância u de separação entre observações e parametrizada por que descreve o grau de associação espacial. Decorre então que para um conjunto finito de observações S~ NMV(0, ²R()), em que R() é a matriz de covariância n x n com (i,j)-ésimo elemento, (u), sendo u=||xi-xj|| a distância euclidiana entre xi e xj. Na presença de correlação a matriz de covariância é definida por uma função de dependência espacial, a partir da distância (u) entre as observações, dada pela função de correlação Matérn (DIGGLE e RIBEIRO JR., 2007):



(3)

em que é a correlação entre pares de pontos separados pela distância u,  é o parâmetro de alcance do modelo, k é o parâmetro que determina a suavidade do processo S(x), (k) é a função Gama e Kk é a função Bessel modificada de terceira tipo de ordem k.



Métodos de estimação dos parâmetros

Mínimos quadrados
O método de mínimos quadrados (MQ) é uma técnica de otimização matemática que procura encontrar o melhor ajuste para um conjunto de dados tentando minimizar a soma dos quadrados das diferenças (resíduos). Desde seu desenvolvimento por Gauss em 1806 esse método se transformou no principal método de estimação de parâmetros (SEAL, 1967; PLACKETT, 1972; STIGLER, 1981) utilizado na análise de dados experimentais. As estimativas das médias dos tratamentos por MQ são dadas por:

(4)

em que F é a matriz do delineamento. E a variância é dada por:



(5)

onde sendo o vetor de resíduos.


Mínimos quadrados generalizados

Neste método de estimação, os parâmetros de correlação, ², ², , são estimados por um semivariograma e as médias dos tratamentos pela teoria dos mínimos quadrados generalizados (MQG), a qual utiliza uma matriz de covariância constituída dos valores do semivariograma. As estimativas dos parâmetros desse semivariograma, são obtidas pelo método de mínimos quadrados n-ponderados (McBratney e Webster, 1986), através da minimização da equação:



(6)

em que, u são as distâncias, freqüentemente denominada lag,, definidas pelos elementos dos conjuntos M(u); N(u) corresponde ao número de pares de parcelas que estão separadas por uma distância u, ou seja, número de elementos em M(u); é o valor da semivariância obtida a partir do semivariograma empírico para as parcelas que estão separadas à distância u e corresponde ao valor das semivariâncias esperadas a partir do semivariograma teórico para as parcelas que estão separadas pela distância u.

Construída a matriz de covariância (R()) através das estimativas dos parâmetros de correlação, as médias dos tratamentos são estimadas pela teoria de mínimos quadrados generalizados como apresentado na equação:

(7)

em que, F é a matriz de delineamento, R()-1 é a inversa generalizada da matriz dos valores do semivariograma entre todos os possíveis pares de locações contendo os dados de y. A estimativa da variância das estimativas da média são dadas por:



(8)
Máxima verossimilhança

Com o desenvolvimento de recursos computacionais o método de máxima verossimilhança (MV) tem sido uma técnica de estimação utilizada com maior freqüência, pois tem propriedades da teoria das grandes amostras, tornando seu resultado mais atrativo. A grande importância do método de máxima verossimilhança consiste nas boas propriedades assintóticas dos estimadores, que são consistentes e assintoticamente eficientes (DIGGLE e RIBEIRO JR., 2007).

Considerando o modelo apresentado em (2) com estrutura de covariância da família Matérn com =1,5, e assumindo que Y ~ NMV(Xµ,² R()+²In), tem-se que a função de verossimilhança é expressa por:

(9)

em que y é o vetor de observações experimentais; F é a matriz do delineamento, é o vetor de parâmetros desconhecidos associados aos efeitos fixos;  são os parâmetros da matriz de covariância, G()=² R()+²In ,com = (²,²,).

A função de verossimilhança é uma função dos parâmetros desconhecidos, portanto, a estimação de máxima verossimilhança consiste em encontrar os valores , estimativas de com máxima plausibilidade de terem produzido os valores observados y, através da maximização do logaritmo da função de verossimilhança dado por:

(10)

Por conveniência computacional, extrai-se um fator escalar a partir de G()=² R()+²In = ²{² + R()} = ²V , onde ²=()=²/². Obtendo-se L(, ´, ², com ´= ²/ dado por:



(11)

Diferenciando-se parcialmente em relação a  e ² e igualando-se as derivadas a zero obtém-se:



(12)

(13)

As estimativas de ´ são obtidas substituindo-se e no logaritmo de função de verossimilhança apresentado na equação (11).


Máxima verossimilhança restrita

Uma variação da Máxima Verossimilhança é a Máxima Verossimilhança Restrita (MVR). Esse método de estimação foi introduzido por PATTERSON e THOMPSON (1971) em delineamentos experimentais. A principal diferença entre os métodos MV e MVR é que o MV usa a função de verossimilhança de Y ou o logaritmo desta função, enquanto o MVR adota a função de verossimilhança de Y*, um vetor de combinações lineares das observações. Este estimador pode ser calculado maximizando a seguinte expressão:



(14)

onde = .

Os valores de que maximizam a equação (14) são calculados da mesma forma da estimação de máxima verossimilhança.
Estudo de simulação

O estudo de simulação foi realizado considerando as características experimentais descritas no Delineamento sistemático tipo leque. Os dados foram gerados com distribuição normal, Y ~ N(,²), incorporando-se três níveis de dependência espacial ( = 5, 3 e 1) entre parcelas com diferentes níveis da razão entre as variâncias dos erros independentes e dependentes (²/² = 0,05 e 0,3) através de um componente de erros aleatórios dependentes gerado aleatoriamente a partir da função grf do pacote geoR (RIBEIRO JR. e DIGGLE, 2001). Com um total de seis situações, para cada uma foram simulados 1000 repetições e a cada conjunto de dados simulados, as estimativas dos parâmetros foram obtidas pelo MLG com estimação por MQ e o MG com estimação por MQG, MV e MVR.


Intervalo de Confiança e Intervalo de Cobertura

Para resumir os dados das simulados, comparar os modelos e métodos de estimação foram construídos intervalos de confiança com um nível de confiança de 95%.

Para o modelo linear gaussiano, o intervalo de confiança foi expresso por:

j=1, ... , 10 (15)

em que, é o valor estimado ao j-ésimo contraste e é o t de Student tabelado a um nível  de significância.

O intervalo de confiança para os métodos de estimação de parâmetros do modelo geoestatístico foi dado por:

j=1, ... , 10 (16)

em que é o z normal tabelado a um nível  de significância.

A partir dos intervalos de confiança foram gerados os intervalos de cobertura (ICBj), que consiste na porcentagem dos intervalos de confiança gerados na simulação que conterem o verdadeiro valor da estimativa da média do tratamento com j=1,...,10. O intervalo de cobertura foi calculado para cada média separadamente a um nível de significância de 5% .

A média dos intervalos de cobertura () foi calculada por:



(17)

Nesse estudo, as análises foram realizadas utilizando o pacote geoR (RIBEIRO JR. e DIGGLE, 2001), do projeto R de computação estatística (R DEVELOPMENT CORE TEAM, 2005).


RESULTADOS E DISCUSSÃO

Os intervalos de cobertura (ICBj) e a média dos intervalos de cobertura () para as simulações com diferentes níveis de dependência espacial estão apresentados na Tabela 1.

(TABELA 1)

De forma geral, os ICBj e  não variaram com diferentes níveis da razão entre as variâncias dos erros independentes e dependentes (²/² = 0,05 e 0,3) dentro do mesmo nível de dependência espacial, mas variam em magnitude em relação aos diferentes valores de alcance. O efeito do alcance () mostrou-se mais importante na avaliação da dependência espacial do que a relação ²/².

Quanto ao desempenho dos modelos, os valores de ICBj e  com baixa dependência espacial mostraram que o MG foi consistentemente melhor do que a MLG. Com o aumento do nível de dependência espacial esses resultados tornaram-se mais evidente a superioridade do MG.

Comparando os diferentes métodos de estimação para MG, os métodos de estimação baseados na verossimilhança (MV e MVR) foram mais eficientes do que o MQG. Sendo que, a superioridade é evidenciada com o aumento do valor de alcance.

Independente dos níveis de dependência espacial entre parcelas a MVR foi superior a MV. Segundo DIGGLE e RIBEIRO JR., 2007 o método de estimação de MVR é considerado melhor do que o MV por ser menos tendencioso para pequenas amostras.

CONCLUSÃO

Os estudos de simulação verificaram que os modelos espaciais ganham em qualidade de estimação em relação ao modelo tradicional e os métodos de estimação baseados na máxima verossimilhança foram mais eficientes.

Deve-se ressaltar que esse estudo consistiu em comparar diferentes modelos (espacial e tradicional) e métodos de estimação na busca por mais eficiência na análise de dados que apresentem dependência espacial. Entretanto, este processo não substitui a recomendação da aleatorização, quando esta é possível, e sim fornece uma alternativa de análise para condições experimentais que impõe restrições aos procedimentos de aleatorização.

Tabela 1 – Intervalos de cobertura das estimativas das médias de tratamentos (ICBj) e média dos intervalos de cobertura (), resultantes da simulação com diferentes níveis de dependência espacial com dois níveis de ²/².


= 1



²/²=0,05

ICB(1)

ICB(2)

ICB(3)

ICB(4)

ICB(5)

ICB(6)

ICB(7)

ICB(8)

ICB(9)

ICB(10)



MLG 1

0,687

0,727

0,773

0,831

0,849

0,871

0,896

0,933

0,937

0,942

0,795

MG-MQG2

0,842

0,861

0,877

0,909

0,918

0,926

0,936

0,964

0,961

0,960

0,865

MG-MV3

0,944

0,938

0,924

0,942

0,929

0,935

0,921

0,948

0,944

0,942

0,887

MG-MVR 4

0,952

0,952

0,939

0,952

0,940

0,944

0,936

0,956

0,950

0,949

0,897

²/²=0,3

ICB(1)

ICB(2)

ICB(3)

ICB(4)

ICB(5)

ICB(6)

ICB(7)

ICB(8)

ICB(9)

ICB(10)



MLG 1

0,685

0,729

0,773

0,831

0,850

0,872

0,893

0,935

0,937

0,942

0,795

MG– MQG2

0,834

0,856

0,874

0,902

0,916

0,921

0,932

0,964

0,959

0,959

0,862

MG – ML3

0,944

0,937

0,926

0,942

0,932

0,935

0,921

0,949

0,942

0,942

0,887

MG– REML 4

0,951

0,951

0,939

0,952

0,940

0,945

0,933

0,959

0,950

0,950

0,897

= 3



²/²=0,05

ICB(1)

ICB(2)

ICB(3)

ICB(4)

ICB(5)

ICB(6)

ICB(7)

ICB(8)

ICB(9)

ICB(10)



MLG 1

0,397

0,440

0,499

0,554

0,584

0,613

0,656

0,717

0,753

0,768

0,548

MG-MQG2

0,808

0,812

0,813

0,833

0,841

0,836

0,841

0,857

0,867

0,863

0,787

MG-MV3

0,937

0,929

0,924

0,930

0,936

0,930

0,912

0,917

0,929

0,915

0,876

MG- MVR 4

0,952

0,945

0,946

0,942

0,950

0,943

0,926

0,932

0,945

0,937

0,892

²/²=0,3

ICB(1)

ICB(2)

ICB(3)

ICB(4)

ICB(5)

ICB(6)

ICB(7)

ICB(8)

ICB(9)

ICB(10)



MLG 1

0,399

0,439

0,500

0,556

0,584

0,614

0,656

0,717

0,753

0,768

0,549

MG– MQG2

0,806

0,813

0,814

0,836

0,840

0,836

0,841

0,859

0,875

0,863

0,788

MG – MV3

0,932

0,928

0,924

0,932

0,936

0,929

0,910

0,918

0,929

0,915

0,875

MG– MVR 4

0,950

0,942

0,945

0,940

0,949

0,942

0,926

0,931

0,945

0,936

0,891

= 5



²/²=0,05

ICB(1)

ICB(2)

ICB(3)

ICB(4)

ICB(5)

ICB(6)

ICB(7)

ICB(8)

ICB(9)

ICB(10)



MLG 1

0,294

0,316

0,347

0,376

0,425

0,479

0,508

0,547

0,583

0,608

0,398

MG-MQG2

0,824

0,812

0,815

0,804

0,824

0,821

0,817

0,821

0,819

0,811

0,767

MG-MV3

0,922

0,918

0,922

0,925

0,923

0,920

0,907

0,899

0,903

0,887

0,863

MG- MVR 4

0,949

0,943

0,939

0,941

0,940

0,941

0,933

0,928

0,929

0,917

0,886

²/²=0,3

ICB(1)

ICB(2)

ICB(3)

ICB(4)

ICB(5)

ICB(6)

ICB(7)

ICB(8)

ICB(9)

ICB(10)



MLG 1

0,296

0,316

0,347

0,378

0,425

0,478

0,511

0,546

0,582

0,608

0,399

MG– MQG2

0,824

0,808

0,814

0,804

0,825

0,819

0,815

0,819

0,820

0,811

0,766

MG – MV3

0,916

0,915

0,919

0,920

0,919

0,917

0,908

0,900

0,892

0,881

0,859

MG– MVR 4

0,944

0,935

0,941

0,939

0,942

0,937

0,929

0,921

0,922

0,914

0,882

1 Modelo linear gaussiano; 2 Modelo geoestatístico com parâmetros estimados por mínimos quadrados generalizados; 3 Modelo geoestatístico com parâmetros estimados por máxima verossimilhança e 4 Modelo geoestatístico com parâmetros estimados por máxima verossimilhança restrita.

5. REFERÊNCIAS BIBLIOGRÁFICAS
BARTLETT, M. S. Nearest neighbour models in the analysis of field experiments with large blocks. Journal of the Royal Statistical Society Series B, v.40, p.147-174, 1978.
BESAG, J.; KEMPTON, R. Statistical analysis of the field experiments using neighbouring plots. Biometrics, v.42, p.231-251, 1986.
BLEASDALE, J. K. A. Systematic designs for spacing experiments. Experimental Agriculture, n.3: p.73-85, 1966.
CRESSIE, N. Statistical for spatial data. New York: John Wiley, 1993, 900p.
DIGGLE, P. J. ; RIBEIRO JR, P. J. . Model Based Geostatistics. New York: Springer, 2007. 230 p.
FREEMAN, G.H. The use of systematic design for a spacing trial with a tropical tree crop. Biometrics, n.20, p.200-203, 1964.
GRONDONA, M. O.; CRESSIE, N. Using spatial considerations in the analysis of experiments. Technometrics, v.33, p.381-392, 1991.
HUMMEL, S. Height, diameter and crown dimensions of Cordia alliodora associated with tree density. Forest Ecology and Management, n.127, p. 31- 40, 2000.
HUXLEY, P.A. Systematic designs for field experimentation with multipurpose trees. Agroforestry Systems, n.3, p.197-207, 1985.
IMADA, M.; KUNISAKI, T.; MIZOUE, N.; TERAOKA,Y. Optimum planting density for Japanese oak (Quercus mongolica var.grosseserrata) based on spacing experiment with systematic design. Journal of Forest Research, n.2, v.2, p.89-93, 1997.
McBRATNEY, A.B.; WEBSTER, R. Choosing functions for semi-variograms of soil properties and fitting them to sampling estimates. Journal of Soil Science, v.77, p.617-639, 1986.
NELDER, J.A. New kinds of systematic designs for spacing experiments. Biometrics, n.18: p.283-307, 1962.
ODA-SOUZA, M.; BARBIN, D.; RIBEIRO JR., P. J.; STAPE, J.L. Aplicação de métodos geoestatísticos para identificação de dependência espacial na análise de dados de um ensaio de espaçamento florestal em delineamento sistemático tipo leque. Revista Árvore, 2009.
PANETSOS, C. P. Selection of new poplar clones under various spacings. Silvae Genetica, n.29, p.130-135, 1980.
PAPADAKIS, J. S. Méthode statistique pour des expériences sur champ. Thessalonike: Institut d’ Amélioration des Plantes à Salonique, 1937, 30p.
PATTERSON, H. D.; THOMPSON, R. Recovery of inter-block information when block sizes are unequal. Biometrika, London, v.58, p.545-554, 1971.
PLACKETT, R. L. Studies in the History of Probability and Statistics. XXIX. The discovery of the method of least squares. Biometrika, n.59, p.239-251, 1972.
R Development Core Team (2005). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, URL http://www.R-project.org.
RIBEIRO JR., P.J.; DIGGLE, P.J. The geoR package functions for geostatistical data analysis: R-NEWS, 1(2):15-18. June, 2001.
SEAL, H. L. Studies in the History of Probability and Statistics. XV. The historical development of the Gauss linear model. Biometrika, n. 54, p.1-24, 1967.
STAPE, J.L. Utilização de delineamento sistemático tipo leque no estudo de espaçamentos florestais. Piracicaba, 1995. 86p. Dissertação (Mestrado) - Escola Superior de Agricultura “Luiz de Queiroz”, Universidade de São Paulo.
STIGLER, S. M. 1981. Gauss and the Invention of Least Squares. The Annals of Statistics, n.9, p.465-474, 1981.
VER HOEF, J.M.; CRESSIE, N. Spatial statistics: Analysis of field experiments. In SHEINER, S. M.; GUREVITCH, J. (Ed.). Design and analysis of ecological experiments. London: Chapman and Hall, 1993, p.319-341.
WAGHORN, M.J, WATT, M. S., MASON, E. G. Influence of tree morphology, genetics, and initial stand density on outerwood modulus of elasticity of 17-year-old Pinus radiate. Forest Ecology and Management, n.244, p. 86–92, 2007.
ZIMMERMAN, D. L.; HARVILLE, D. A. A random field approach to the analysis of field-plot experiments and other spatial experiments. Biometrics, v.47, p.223-239, 1991.


Figura 1 - Croqui de instalação do experimento sistemático leque com 10 tratamentos e 36 repetições com Eucalyptus dunnii



Figure 1 – Fan systematic design installation outline with 10 treatments and 36 repetitions

with Eucalyptus dunni.


Compartilhe com seus amigos:


©aneste.org 2020
enviar mensagem

    Página principal
Universidade federal
Prefeitura municipal
santa catarina
universidade federal
terapia intensiva
Excelentíssimo senhor
minas gerais
união acórdãos
Universidade estadual
prefeitura municipal
pregão presencial
reunião ordinária
educaçÃo universidade
público federal
outras providências
ensino superior
ensino fundamental
federal rural
Palavras chave
Colégio pedro
ministério público
senhor doutor
Dispõe sobre
Serviço público
Ministério público
língua portuguesa
Relatório técnico
conselho nacional
técnico científico
Concurso público
educaçÃo física
pregão eletrônico
consentimento informado
recursos humanos
ensino médio
concurso público
Curriculum vitae
Atividade física
sujeito passivo
ciências biológicas
científico período
Sociedade brasileira
desenvolvimento rural
catarina centro
física adaptada
Conselho nacional
espírito santo
direitos humanos
Memorial descritivo
conselho municipal
campina grande