ESTUDIO DE POTENCIA DE PRUEBAS DE NORMALIDAD USANDO DISTRIBUCIONES DESCONOCIDAS CON DISTINTOS NIVELES DE NO NORMALIDAD

Autores/as

  • Pablo Flores Muñoz Escuela Superior Politécnica de Chimborazo, Facultad de Ciencias, Grupo de Investigación en Ciencia de Datos, Riobamba, Ecuador
  • Laura Muñoz Escobar Universidad Nacional de Chimborazo, Facultad de Ciencias de la Educación, Humanas y Tecnologías, Riobamba, Ecuador, Riobamba, Ecuador.
  • Tania Sánchez Acalo Escuela Superior Politécnica de Chimborazo, Facultad de Ciencias, Grupo de Investigación en Ciencia de Datos, Riobamba, Ecuador

DOI:

https://doi.org/10.47187/perf.v1i21.42

Palabras clave:

Pruebas de normalidad, potencia, equivalencia, simulación, coeficientes de Fleishman

Resumen

La mayoría de pruebas de hipótesis paramétricas están sujetas al cumplimiento de normalidad. Debido a la gran variedad de opciones para contrastar este supuesto, se considera como mejor alternativa el test que presente una mayor potencia. Investigaciones preliminares estiman este valor a partir de muestras provenientes de distribuciones no normales conocidas pero cuyo alejamiento o contaminación respecto a la normalidad se desconoce. En el presente estudio seleccionamos siete pruebas que además de ser las más comunes parecen ser las mejores. Mediante un proceso de simulación, estimamos la potencia de cada una de ellas usando  muestras provenientes de distribuciones desconocidas, pero con un alejamiento medible de la normalidad. Parece ser que el test de Shapiro – Wilk es la mejor opción, su potencia es muy elevada, pero solo para muestras no normales grandes y alejamientos fuertes. Para distribuciones con alejamientos débiles y muestras pequeñas parece ser que ninguna de las pruebas tradicionales en estudio es buena. Se discute un posible mal planteamiento de estos test y su incidencia en los resultados obtenidos. Finalmente se introduce la posibilidad de incluir pruebas basadas en el enfoque de equivalencia, las cuales quizás podrían resultar mejores que las pruebas estudiadas.

Descargas

Los datos de descargas todavía no están disponibles.

Citas

Recent and classical tests for normality-a comparative study. Baringhau, L, Danschke, R y Henze, N. 1, 1989, Communications in Statistics-Simulation and Computation, Vol. 18.

D’Agostino, Ralph y Stephens, Michael. Goodness-of-fit techniques (Statistics, a series of text- books and monographs. New York : Marcel Deker, 1986.

Tests of unvariate and multivariate normality. Mardia, Kanti. 1980, Handbook of statistics, Vol.1.

Simulation based finite sample normality test in linear regressions. Dufour, Jean-Marie, y otros.1998, Econometrics Journal, Vol. 1.

A comparison of various tests of normality. Yazici, Berna y Yolacan, Senay. 2, 2007, Journal of

Statistical and Simulation, Vol. 77.

An empirical power comparison of univariate goodness of fit test for normality. Romao, Xavier, Delgado, Raimundo y Costa, Aníbal. 5, May de 2010, Journal of Statistical Computation and Simulation, Vol. 80.

Comparisons of various types of normality tests. Yap, B y Sim, C. 12, December de 2011, Journal of Statistical Computation and Simulation, Vol. 81.

A method for simulating non-normal distributions. Fleishman, Allen. 4, 1978, Psycometrika, Vol. 43.

Sulla determinazione empirica di una lgge di distribuzione. Kolmogorov, Andrey. 1933, Inst. Ital. Attuari, Giorn., Vol. 4.

Table for estimating the goodness of fit of empirical distributions. Smirnov, Nickolay. 2, 1948, The annals of mathematical statistics, Vol. 19.

On the Kolmogorov-Smirnov test for normality with mean and variance unknown. Lilliefors, Hubert. 318, 1967, Journal of the American statistical Association, Vol. 62.

An analysis of variance test for normality. Shapiro, SS y Wilk, MB. 3, 1965, Biometrika, Vol. 52.

Asymptotic theory of certain" goodness of fit" criteria based on stochastic processes. Anderson, Theodore y Darling, Donald. 1952, The annals of mathematical statistics}, Vol. 23.

EDF statistics for goodness of fit and some comparisons. Stephens, Michael. 347, 1974, Journal of the American statistical Association, Vol. 69.

Efficient tests for normality, homoscedasticity and serial independence of regression residuals. Jarque, Carlos y Bera, Anil. 3, 1980, Economics Letters, Vol. 6.

Greenwood, Priscilla y Nikulin, Michael. A guide to chi-squared testing. 280. s.l. : John Wiley

& Sons, 1996.

On the composition of elementary errors: First paper: Mathematical deductions. Cramér, Harald. 1928, Scandinavian Actuarial Journal, Vol. 1.

Skewness and kurtosis in real data samples. Blanca, María, y otros. 2013, Methodology.

R: A Language and Enviroment for Statistical Computing. Team, R Core. 2018, R Foundation For Statistical Computing. https://www.R-project.org.

Comparison of the procedures of Fleishman and Ramberg et al. For generating non-normal data in simulation studies. Bendayan, Rebecca, y otros. 1, 2014, Annals of Psychology, Vol. 30.

BinNonNor: Data Generation with Binary and Continuous Non-Normal Components. Inan, Gul y Demirtas, Hakan. 2018, R package version 1.4.

Robustness in the strategy of scientific model building. Box, George. 1979, Army res off Work Robustness, Vol. 1.

Wellek, Sthepan. Testing St atistical Hypothesis of equivalence and non Inferiority. 2010.

Heteroscedasticity Irrelevance when Testing Means Difference. Flores, Pablo y Ocaña, Jordi. 1, June de 2018, SORT, Vol. 42.

EDF statistics for goodness of fit and some comparisons. Stephens, Michael. 1974, Journal of the American statistical Association, págs. 730--737.

Descargas

Publicado

2019-06-30

Cómo citar

Flores Muñoz, P., Muñoz Escobar, L., & Sánchez Acalo, T. (2019). ESTUDIO DE POTENCIA DE PRUEBAS DE NORMALIDAD USANDO DISTRIBUCIONES DESCONOCIDAS CON DISTINTOS NIVELES DE NO NORMALIDAD. Perfiles, 1(21), 4-11. https://doi.org/10.47187/perf.v1i21.42