Ciclo de Palestras 2006 – 2º Semestre

Palestras do Departamento de Metodos Estatísticos - Instituto de Matemática - UFRJ

As palestras são realizadas na sala C116 do Centro Tecnológico as 15:30 hs, a menos que ocorra aviso em contrário

06/12 Prévias de Mestrado

A teoria do risco tradicional assume que os riscos individuais de uma carteira de seguro sejam independentes. A determinação da função distribuição dos sinistros agregados é obtida através de recursões de Panjer ou de De Pril, convoluções ou aproximação por momentos. A tendência moderna em atuaria é modelar conjuntamente os riscos atuárial e finaceiro, gerando, como veremos, somas de variáveis aleatórias dependentes. Grande esforço tem sido desenvolvido, na literatura recente, para determinar limites superior e inferior para a distribuição do sinistro agregado. Nesta apresentação ilustraremos esses principios e nossa proposta futura é fazer a inferência nesses modelos, sobretudo do ponto de vista Bayesiano.

O termo pequenos domínios (ou pequenas áreas) é freqüentemente utilizado para denominar áreas geográficas pequenas, tais como municípios, distritos e bairros. Num sentido mais amplo, é utilizado também para descrever um pequeno subconjunto da população, podendo ser, inclusive, resultado da classificação cruzada de duas ou mais variáveis. As informações para pequenas áreas podem ser obtidas a partir de censos e enumerações populacionais, com a população sendo inteiramente investigada, ou através de pesquisas por amostragem. Pesquisas por amostragem geralmente têm como principal característica um tamanho de amostra reduzido nas pequenas áreas; ou até mesmo a ausência de unidades amostrais em algumas áreas. Dessa forma, não é possível obter estimativas com boa precisão a partir de estimadores diretos, baseados unicamente no desenho da amostra. Uma alternativa é utilizar uma abordagem que considere também as estimações de regiões vizinhas no espaço e no tempo. Para isso, são utilizados aqui, modelos dinâmicos bayesianos de crescimento exponencial com componentes que variam espacialmente segundo um processo gaussiano. Particularmente, apresentamos uma aplicação à dados do Censo Demográfico Brasileiro e da Pesquisa Nacional por Amostra de Domicílios (PNAD), ambos divulgados pelo Instituto Brasileiro de Geografia e Estatística (IBGE). O objetivo é obter as estimativas dos tamanhos populacionais dos municípios incluídos na amostra da PNAD, combinando os dados da pesquisa com aqueles dos censos. Ao utilizar dados de pesquisas com diferentes variabilidades e tipos de erros, é preciso considerar de modo diferenciado as precisões das informações levantadas. Neste trabalho, propomos uma modelagem conjunta de média e variância para identificar a quantidade de informação de um estimador a partir da estimativa de sua variância.

11/10

Nesta palestra, será considerado o Problema de Agrupamento (Clustering) segundo o critério de mínima soma de quadrados dentro dos grupos, ou equivalentemente, minimização da variância intragrupos. Esse critério, sendo muito natural, é o mais freqüentemente usado nas formulações de problemas de agrupamento. Adicionalmente à significante característica de sua natureza bi-nível, o problema associado tem a característica de ser fortemente não-diferenciável. A fim de superar essas dificuldades, a nova metodologia de resolução proposta adota uma estratégia de suavização usando uma especial função completamente diferenciável. Com o propósito de demonstrar a eficiência e a robustez do método, resultados computacionais obtidos na resolução de um conjunto canônico de problemas teste, descritos na literatura, são apresentados.

30/08

This paper examines local influence in exponential generalized autoregressive conditional heteroscedasticity (EGARCH) models. The analyses of local influence is discussed under three perturbations schemes: data perturbation and innovative and additive model perturbation. For each case expressions for slope and curvature diagnostics are derived. Monte Carlo experiments are presented in order to determine threshold values for locating influential observations. In addition, the empirical study of daily returns of the New York Stock Exchange composite index shows that local influence analyses is an important device for determining and classifying shocks in the market.

17/08
22/11

In a recent statistical literature, several concepts of a median of a multidimensional data set or a distribution have been introduced. The idea is always to select one determining property of the median of a real valued random variable and then try to generalize it in more dimensions. However, properties that are equivalent in one dimension are not necessarily equivalent in higher dimensions, and this is the reason why none of approachesmakes a definitive solution to defining what is also known as a center of multidimensional data set or a multivariate distribution. The talk is about yetanother approach, where we start with a novel equivalent definition of a median in a univariate case, extend it to multivariate, and then show a numberof interesting results in theory and applications. We discuss some properties of Type D depth functions introduced by Zuo and Serfling, Ann. Statistics 28 (2000), 461–482, and we show that the only reasonably well behaved depth function of this type is the halfspace depth.

08/11 Prévias de Mestrado (excepcionalmente na sala C-100)

Nesta dissertação é feito um estudo generalizado da Teoria de Resposta ao Item (TRI) através de propostas que permitam a modelagem do funcionamento diferencial do item – DIF (Differential Item Functioning) no contexto da TRI usando uma abordagem bayesiana. Primeiramente, é proposto um modelo de TRI que considera a existência de DIF(na discriminação e na dificuldade), porém, assumindo-se a hipótese de que os itens com DIF são conhecidos. São feitos estudos de simulação para analisar a eficiência do modelo e da metodologia utilizada para se fazer a inferência. Além disso, o modelo é aplicado para a análise de um conjunto de dados reais referente ao Programa Nova Escola do Estado do Rio de Janeiro. Posteriormente, é proposto um modelo que engloba a detecção de itens com DIF, ou seja, que não necessite da hipótese de se conhecer quais itens possuem funcionamento diferencial. Novamente, são feitos estudos de simulação com tal modelo e também a análise do mesmo conjunto de dados reais.

Nos últimos tempos vem crescendo o número de aplicações práticas realizando análises de dados espacialmente distribuídos em uma área. Diferentes modelagens podem ser determinadas dependendo do tipo de problema que se deseja estudar. A modelagem considerada neste trabalho leva em conta a divisão desta área em n regiões. Para cada região a variável de interesse é observada sendo o conjunto completo de observações.A estrutura de vizinhança que estabelece a relação de dependência entre as observações é um aspecto importante a ser considerado. O estudo de uma série de dados observados objetiva modelar e analisar esta dependência. A estrutura espacial mais simples é configurada da seguinte forma: A i-ésima observação, , apresenta dois vizinhos que são e . Perceba que esta particular estrutura representa também uma série temporal com n observações, que está na classe dos Modelos Dinâmicos Lineares (MDL’s). Estruturas de vizinhanças mais complexas podem ser consideradas, isto é, uma observação qualquer apresenta três ou mais vizinhos. Neste caso devem ser utilizados modelos espaciais com estrutura de vizinhança mais geral. Levando em consideração as diferentes possibilidades de especificação de uma estrutura espacial surge a seguinte reflexão: Quando uma área dividida em n regiões é analisada pode-se ter estruturas de vizinhanças mais simples, onde a maioria das regiões apresenta no máximo dois vizinhos, ou estruturas mais gerais onde o número de vizinhos é grande. Existiria influência da quantidade de vizinhos sobre o desempenho do modelo espacial utilizado? Que tipo de alterações observam-se nos resultados fornecidos ou nos algoritmos utilizados por estes modelos conforme o número de vizinhos é aumentado? A busca pela resposta destas questões tornou-se o principal objetivo que motivou o desenvolvimento deste trabalho. A análise bayesiana é empregada aqui e três esquemas, propostos na literatura, serão utilizados para a amostragem da distribuição a posteriori dos parâmetros do modelo. Estes esquemas diferem-se basicamente na estrutura de blocagem dos parâmetros que podem ser amostrados separadamente ou conjuntamente. É por meio deles que será estudado o desempenho dos modelos espaciais e dos algoritmos MCMC por eles utilizados perante diferentes quantidades de vizinhos.Iniciando pela aplicação de um modelo espacial simples este trabalho desempenha também uma extensão estudando o modelo espacial com componente de regressão múltipla. Diferentes aspectos são considerados para análise, entre eles estão resultados de inferência, verificação de convergência e análise da estrutura de autocorrelação das cadeias obtidas.

20/09

Os modelos hidrológicos são ferramentas úteis para o entendimento do comportamento hidrológico de bacias hidrográficas. Estes modelos deveriam representar grande parte dos processos hidrológicos a fim de produzir resultados realistas. Entretanto, os modelos são apenas uma aproximação da realidade e requerem uma boa inicialização das variáveis de estado e uma grande quantidade de dados para representar apropriadamente os processos envolvidos. Esta apresentação visa discutir as diferentes abordagens utilizadas na construção de modelos hidrológicos distribuídos. Inicialmente, será apresentado o ciclo hidrológico e seus componentes. Aspectos relativos a discretização espacial e temporal serão também discutidos. Especificamente, serão apresentados os resultados do desenvolvimento do sistema SASHI (Sistema de Análise e Simulação Hidrológica). O enfoque principal é mostrar as diferenças das variáveis que alimentam modelos deste tipo.