Saturday 14 October 2017

Zero inflated binary options


Argumentos passados ​​para zeroinfl. control na configuração padrão. Os modelos de contagem zero-inflados são modelos de mistura de dois componentes que combinam uma massa de ponto em zero com uma distribuição de contagem apropriada. Assim, existem duas fontes de zeros: os zeros podem vir tanto da massa pontual como da componente de contagem. Normalmente o modelo de contagem é um Poisson ou regressão binomial negativa (com log link). A distribuição geométrica é um caso especial do binômio negativo com parâmetro de tamanho igual a 1. Para modelar o estado não observado (zero versus contagem), um modelo binário é usado que captura a probabilidade de inflação zero. No caso mais simples, apenas com um intercepto mas potencialmente contendo regressores. Para este modelo de inflação zero, um modelo binomial com diferentes links pode ser usado, tipicamente logit ou probit. A fórmula pode ser usada para especificar ambos os componentes do modelo: Se uma fórmula de tipo y x1 x2 é fornecida, então os mesmos regressores são empregados em ambos os componentes. Isto é equivalente a y x1 x2 x1 x2. Naturalmente, um conjunto diferente de regressores poderia ser especificado para a contagem e componente de inflação nula, e. Y x1 x2 z1 z2 z3 dando o modelo de dados de contagem y x1 x2 condicional em () o modelo de inflação zero y z1 z2 z3. Um modelo de inflação simples, onde todas as contagens zero têm a mesma probabilidade de pertencer ao componente zero podem ser especificados pela fórmula y Deslocamentos podem ser especificados em ambos os componentes do modelo relativo ao modelo de contagem e inflação zero: y x1 deslocamento (x2) Z1 z2 deslocamento (z3). Onde x2 é usado como um deslocamento (isto é, com o coeficiente fixado a 1) na componente de contagem e z3 analogamente na componente de inflação nula. Pela regra indicada acima y x1 offset (x2) é expandido para y x1 offset (x2) x1 offset (x2). Em vez de usar o wrapper offset () dentro da fórmula. O argumento offset também pode ser empregado que define um deslocamento apenas para o modelo de contagem. Assim, a fórmula y x1 eo deslocamento x2 é equivalente à fórmula y x1 offset (x2) x1. Todos os parâmetros são estimados pela máxima verossimilhança usando optim. Com opções de controle definidas em zeroinfl. control. Os valores iniciais podem ser fornecidos, estimados pelo algoritmo EM (maximização da expectativa), ou por glm. fit (o padrão). Os erros padrão são derivados numericamente usando a matriz de Hessian retornada pelo optim. Consulte zeroinfl. control para obter detalhes. O objeto modelo montado retornado é de classe zeroinfl e é semelhante aos objetos glm ajustados. Para elementos como coeficientes ou termos uma lista é retornada com elementos para o zero e contagem de componentes, respectivamente. Para detalhes veja abaixo. Um conjunto de funções de extração padrão para objetos modelo montados está disponível para objetos da classe zeroinfl. Incluindo métodos para as funções genéricas de impressão. resumo. Coef Vcov. LogLik. Resíduos. prever. Montado. Termos. Model. matrix. Consulte predict. zeroinfl para obter mais detalhes sobre todos os métodos. Um objeto da classe zeroinfl. Este artigo propõe um modelo de regressão binomial binário bivariado com inflação zero para os dados de contagem com zeros em excesso e fornece um método de estimativa baseado no EM e quasi - Algoritmos de Newton. É dada uma aplicação à análise da utilização dos cuidados de saúde. Distribuição binomial negativa bivariada Contagem de dados com zeros em excesso Correlação EM algoritmo Sobredispersão Classificação JEL Autor correspondente. Tel. 65-6790-6217 fax: 65-6792-4217. Copyright copy 2002 Elsevier Science B. V. Todos os direitos reservados. Os cookies são usados ​​por este site. Para obter mais informações, visite a página de cookies. Copyright 2017 Elsevier B. V. ou seus licenciadores ou contribuintes. ScienceDirect é uma marca registrada da Elsevier B. V.Welcome para o Instituto de Pesquisa Digital e Educação SAS Análise de Dados Exemplos Zero Inflated Poisson Regressão Versão info. O código para esta página foi testado no SAS 9.3 A regressão Poisson com inflação zero é usada para modelar dados de contagem que têm um excesso de contagens zero. Além disso, a teoria sugere que os zeros em excesso são gerados por um processo separado dos valores de contagem e que os zeros em excesso podem ser modelados independentemente. Assim, o modelo zip tem duas partes, um modelo de contagem de Poisson eo modelo logit para predizer zeros em excesso. Você pode querer rever estas páginas de Exemplo de Análise de Dados, Regressão de Poisson e Regressão Logit. Observação: O objetivo desta página é mostrar como usar vários comandos de análise de dados. Não abrange todos os aspectos do processo de investigação que se espera que os investigadores façam. Em particular, não abrange a limpeza e verificação de dados, verificação de suposições, diagnósticos de modelos e potenciais análises de acompanhamento. Exemplos de regressão de Poisson com inflação zero Exemplo 1. Os administradores escolares estudam o comportamento de freqüência de alunos do ensino médio em um semestre em duas escolas. O comparecimento é medido pelo número de dias de ausência e é predito por sexo do aluno e pontuação de teste padronizado em matemática e artes da linguagem. Muitos estudantes não têm ausências durante o semestre. Exemplo 2. Os biólogos estaduais da vida selvagem querem modelar quantos peixes estão sendo pescados por pescadores em um parque estadual. Os visitantes são perguntados se eles têm ou não um campista, quantas pessoas estavam no grupo, houve crianças no grupo e quantos peixes foram capturados. Alguns visitantes não pescam, mas não há dados sobre se uma pessoa pescou ou não. Alguns visitantes que fizeram peixe não pegar qualquer peixe, por isso há excesso zeros nos dados por causa das pessoas que não pescar. Descrição dos dados Vamos buscar o exemplo 2 acima usando o conjunto de dados fish. sas7bdat. Temos dados sobre 250 grupos que foram a um parque. Cada grupo foi questionado sobre quantos peixes eles pegaram (contagem), quantas crianças estavam no grupo (criança), quantas pessoas estavam no grupo (pessoas) e se traziam ou não um campista para o parque (campista) . Além de prever o número de peixes capturados, há interesse em prever a existência de zeros em excesso, ou seja, os zeros que não foram simplesmente um resultado da pesca de má sorte. Vamos usar as variáveis ​​criança. pessoas . E campista em nosso modelo. Vamos olhar para os dados. Métodos de análise que você pode considerar Abaixo está uma lista de alguns métodos de análise que você pode ter encontrado. Alguns dos métodos listados são bastante razoáveis, enquanto outros têm caído fora de favor ou têm limitações. Regressão de Poisson com inflação zero - O foco desta página da web. Regressão binomial negativa com inflação zero - A regressão binomial negativa é melhor com dados dispersos, isto é, variância muito maior que a média. Modelos de Contagem Ordinária - Poisson ou modelos binomiais negativos podem ser mais apropriados se não houver zeros em excesso. OLS Regression - Você poderia tentar analisar esses dados usando a regressão OLS. No entanto, os dados de contagem são altamente não-normais e não são bem estimados por regressão OLS. Análise de regressão de Poisson com influxo zero do SAS usando proc genmod Se você estiver usando o SAS versão 9.2 ou superior, você pode executar um modelo Poisson com inflação zero usando proc genmod. A saída começa com um resumo do modelo e dos dados. Isto é seguido por uma lista de estatísticas de bondade de ajuste. O próximo bloco de saída inclui estimativas de parâmetros a partir da porção de contagem do modelo. Inclui também os erros padrão, os intervalos de confiança de Wald 95, as estatísticas de Wald Chi-quadrado e os valores de p para as estimativas dos parâmetros. O último bloco de saída corresponde à porção de inflação zero do modelo. Este é um modelo logístico que prevê os zeros. O resultado inclui estimativas de parâmetros para os preditores de modelos de inflação e seus erros padrão, intervalos de confiança Wald 95, estatísticas Wald Chi-quadrado e valores p. Todos os preditores nas porções de contagem e inflação do modelo são estatisticamente significativos. Este modelo ajusta os dados significativamente melhor do que o modelo nulo, isto é, o modelo apenas de intercepção. Para mostrar que este é o caso, podemos executar o modelo nulo (um modelo sem quaisquer preditores) e comparar o modelo nulo com o modelo atual usando o teste chi-quadrado na diferença de probabilidades de log. As probabilidades de log para o modelo completo e modo nulo são -1031.6084 e -1127.0229, respectivamente. O valor do qui-quadrado é 2 (-1031.6084 - -1127.0229) 190.829. Como temos três variáveis ​​preditoras no modelo completo, os graus de liberdade para o teste qui-quadrado são 3. Isso produz um valor de p lt.0001. Assim, o nosso modelo global é estatisticamente significativo. Podemos querer comparar o modelo Poisson com inflação zero atual com o modelo de poisson simples, o que pode ser feito com o teste de Vuong. Atualmente, o teste Vuong não é uma parte padrão do proc genmod. Mas um programa macro que executa o teste Vuong está disponível no SAS aqui. O uso do programa de macro requer a instrução include, na qual listamos o local da macro. Esse programa de macro leva alguns argumentos, como mostrado abaixo. Voltamos a executar os modelos para obter produzir estes argumentos de entrada necessários. Com o modelo de Poisson com inflação zero, há um total de cinco parâmetros de regressão que inclui a interceptação, os coeficientes de regressão para criança e campista para a porção de Poisson do modelo, bem como o coeficiente de interceptação e regressão para as pessoas. O modelo de regressão de Poisson simples tem um total de três parâmetros de regressão. O parâmetro de escala é o parâmetro de dispersão de cada modelo correspondente e para o nosso modelo de poisson é fixado em 1. Para o teste de Vuong, um z significativo indica que o modelo inflado é melhor. Aqui vemos que o modelo preferido é um modelo de Poisson com inflação zero sobre um modelo de Poisson regular. Os valores positivos das estatísticas z para o teste de Vuong indicam que ele é o primeiro modelo, o modelo poisson com inflação zero, que está mais próximo do modelo verdadeiro. Podemos usar a instrução de estimativa para ajudar a entender nosso modelo. Vamos calcular as contagens esperadas para a variável categórica camper enquanto mantém a variável contínua child em seu valor médio usando a opção atmeans, bem como calcular a probabilidade prevista de que uma observação veio do processo gerador de zero. Na declaração de estimativa, fornecemos valores para avaliar cada coeficiente tanto para o modelo de Poisson como para o modelo de inflação zero. Os conjuntos de coeficientes dos dois modelos são separados pela palavra-chave ZERO. Na coluna Estimativa Média, encontramos contagens preditas de peixes do modelo de Poisson, ignorando o modelo de inflação zero, tanto para o campista 0 como para o campista 1, bem como a probabilidade prevista de pertencer ao processo gerador de zero a partir do zero - Inflação. O modelo de inflação zero não inclui campista como um preditor, então a probabilidade de zero para ambos os modelos de inflação zero é a mesma. Para obter as contagens esperadas de peixe a partir da mistura dos dois modelos, basta multiplicar as contagens esperadas do modelo de Poisson pela probabilidade de obter um não-zero do modelo de inflação zero (1 - p (zero)). Assim, as contagens esperadas de peixes para campista 0 e campista 1 incluindo inflação zero são 2,422 (1-0,4677) 1,289 e 5,5768 (1-0,4677) 2,968, respectivamente. Análise de Poisson com inflação zero usando proc countreg Proc countreg é outra opção para executar uma regressão de Poisson com inflação zero em SAS (novamente, versão 9.2 ou superior). Este procedimento permite algumas opções mais específicas para a contagem de resultados que o genmod. O código de coun countreg para o modelo original executado nesta página aparece abaixo. Nós indicamos o método qn para especificar o processo de otimização de quase-Newton que corresponde aos resultados do genmod de proc. SAS Análise de Poisson zero-inflada usando proc nlmixed Para aqueles que usam uma versão do SAS antes de 9.2, um modelo binomial negativo inflacionado é factível, embora significativamente mais difícil. Por favor, veja este fragmento de código: Poisson de Zero-inchado e Binomial Negativo Usando Proc Nlmixed. Coisas a considerar Uma vez que o zip tem um modelo de contagem e um modelo logit, cada um dos dois modelos deve ter bons preditores. Os dois modelos não precisam necessariamente usar os mesmos preditores. Problemas de predição perfeita, separação ou separação parcial podem ocorrer na parte logística do modelo com inflação zero. Os dados de contagem costumam usar variáveis ​​de exposição para indicar o número de vezes que o evento poderia ter acontecido. Você pode incorporar a exposição em seu modelo usando a opção exposure (). Não se recomenda que modelos de poisson com inflação zero sejam aplicados a pequenas amostras. O que constitui uma pequena amostra não parece estar claramente definido na literatura. Pseudo-R-quadrado valores diferem de OLS R-squareds, consulte FAQ: O que são pseudo R-squareds para uma discussão sobre este problema. Referências Cameron, A. Colin e Trivedi, P. K. (2009) Microeconometria usando stata. College Station, TX: Imprensa Stata. Long, J. Scott (1997). Modelos de regressão para variáveis ​​categóricas e dependentes limitadas. Thousand Oaks, CA: Publicações Sage. O conteúdo deste site não deve ser interpretado como um endosso de qualquer site, livro ou produto de software específico pela Universidade da Califórnia.

No comments:

Post a Comment