Поступила: 09.10.2024
Принята к публикации: 10.11.2024
Дата публикации в журнале: 20.06.2025
Ключевые слова: нормальное распределение, многовыборочные данные, устойчивость разложения вероятностных законов, теорема Леви—Крамера, Монте-Карло-моделирование
DOI: 10.55959/MSU/0137–0782–15–2025–49–2–58–68
Ушакова А.П., Ушаков В.Г., Ушаков Н.Г. Проверка гипотезы нормальности по многим малым выборкам // Вестник Московского университета. Серия 15. Вычислительная математика и кибернетика. 2025. № 2. С. 58-68 https://doi.org/10.55959/MSU/0137–0782–15–2025–49–2–58–68.
Для многих статистических процедур существенным является предположение, что исходные данные имеют нормальное распределение. Однако, если это предположение недостаточно обосновано, использование этих процедур может привести к ложным выводам. По этой причине проблеме проверки нормальности уделено большое внимание в литературе. В данной работе рассматривается проверка нормальности в случае, когда данные состоят из ряда небольших независимых выборок, в каждой из которых наблюдения независимы и одинаково распределены, но от выборки к выборке имеют разные параметры сдвига и масштаба. В таких случаях необходимо использовать статистики, не зависящие от параметров. Естественный путь исключить параметр сдвига — заменить наблюдения в каждой малой выборке их разностями. В работе получены оценки устойчивости таких разложений и проводится сравнение мощности нескольких критериев нормальности по преобразованным данным.
P e a r s o n K. On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonable supposed to have arisen from random sampling // Philos. Mag. 1900. 50. P. 157–175.
C r a m e r H. On the composition of elementary errors // Skandinavisk Aktuarietidskrift. 1928. 11. P. 13–74, 141–180.
Vo n M i s e s R. Wahrscheinlichkeitsrechnung und Ihre Anwendung in der Statistik und Theoretischen Physik. Leipzig: Deuticke, 1931.
K o l m o g o r o v A. N. Sulla Determinazione empiricadi una legge di distribuzione // Giorna. Ist. Attuari. 1933. 4. P. 83–91.
S m i r n o v N. V. Sui la distribution de w2 (Criterium de M.R.v. Mises) // C. R. Paris. 1936. 202. P. 449–452.
S m i r n o v N. V. Sur les ’ecarts de la courbe de distribution empirique // French/Russian Su Matematiceskii Sbornik N.S. 1939. 6. P. 3–26.
A n d e r s o n T. W., D a r l i n g D. A. Asymptotic theory of certain “goodness-of-fit” criteria based on stochastic processes // Ann. Math. Stat. 1952. 23. P. 193–212.
A n d e r s o n T. W., D a r l i n g D. A. A test of goodness of fit // J. Amer. Statist. Assoc. 1954. 49. P. 765–769.
S h a p i r o S. S., Wi l k M. B. An analysis of variance test for normality (complete samples) // Biometrika. 1965. 53. P. 591–611.
L i l l i e f o r s H. W. On the Kolmogorov–Smirnov test for normality with mean and variance unknown // J. Amer. Statist. Assoc. 1967. 62. P. 534–544.
M a r d i a K. V. Measures of multivariate skewness and kurtosis with applications // Biometrika. 1970. 57. P. 519–530.
S h a p i r o S. S., F r a n c i a R. S. An approximate analysis of variance test for normality // J. Amer. Statist. Assoc. 1972. 67. P. 215–216.
B o w m a n K. O., S h e n t o n L. R. Omnibus test contours for departures from normality based on √b1 and b2 // Biometrika. 1975. 62. P. 243–250.
J a r q u e C. M., B e r a A. K. Efficient tests for normality, homoscedasticity and serial independence of regression residuals // Economics Letters. 1980. 6. P. 255–259.
K o u t r o u v e l i s I. A. A goodness-of-fit test of simple hypotheses based on the empirical characteristic function // Biometrika. 1980. 67. P. 238–240.
K o u t r o u v e l i s I. A., K e l l e r m e i e r J. A goodness-of-fit test based on the empirical characteristic function when parameters must be estimated // J.R. Statist. Soc. B. 1981. 43. P. 173–176.
E p p s T. W., P u l l e y L. B. A test for normality based on the empirical characteristic function // Biometrika. 1983. 70. P. 723–726.
E p p s T. W., S i n g l e t o n K., P u l l e y L. B. A test of separate families of distributions based on the empirical moment generating function // Biometrika. 1982. 69. P. 391–399.
D ’A g o s t i n o R.B., S t e p h e n s M. A. Goodness-of-fit Techniques. N.Y.: Marcel Dekker, 1986.
J a r q u e C. M., B e r a A. K. A test for normality of observations and regression residuals // Int. Stat. Rev. 1987. 55. P. 163–172.
B a r i n g h a u s L., H e n z e N. A consistent test for multivariate normality based on the empirical characteristic function // Metrika. 1988. 35. P. 339–348.
T h o d e H. C. Testing for Normality. N.Y.: Marcel Dekker, 2002.
Ya z i c i B., Yo l a c a n S. A comparison of various tests of normality // J. Statist. Comput. Simul. 2007. 77. P. 175–183.
M e i n t a n i s S. G. A Kolmogorov–Smirnov type test for skew normal distributions based on the empiricalmoment generating function // J. Stat. Plan. Inference. 2007. 137. P. 2681–2688.
M e i n t a n i s S. G. Testing skew normality via the moment generating function // Math. Methods. Stat. 2010. 19. P. 64–72.
R o m ˜a o X., D e l g a d o R., C o s t a A. An empirical power comparison of univariate goodness-of-fit tests for normality // J. Statist. Comput. Simul. 2010. 80. P. 545–591.
Ya p B.W., S i m C. H. Comparisons of various types of normality tests // J. Statist. Comput. Simul. 2011. 81. P. 2141–2155.
H e n z e N., J i m ’e n e z - G a m e r o M. D., M e i n t a n i s S. G. Characterizations of multinormality and corresponding tests of fit, including for GARCH models // Econometric Theory. 2019. 35. P. 510–546.
E b n e r B., H e n z e N. Tests for multivariate normality — a critical review with emphasis on weighted L2-statistics // TEST. 2020. 29. P. 845–892.
H e n z e N., K o c h S. On a test of normality based on the empirical moment generating function // Statist. Papers. 2020. 61. P. 17–29.
O e r t e l A. C. Frequency distribution of spectrographic error in d.c. arc excitation of soil samples // Austral. J. Appl. Sci. 1956. 7. P. 133–141.
P e t r o v A. A. Verification of statistical hypotheses on the type of a distribution based on small samples // Theory Probab. Applic. 1956. 1. P. 223–245.
Z i n g e r A. A. On a problem of A. N. Kolmogorov // Vestnik Leningrad Univ. 1956. 11. P. 53–56.
L ’e v y P. Propri’et’es asymptotiques des sommes de variables al’eatoires ind’epen-dantes ou enchaˆin’ees // J. Math. Pures Appl. 1935. 14. P. 347–402.
C r a m e r H. ‥Uber eine Eigenschaft der normalen Verteilungsfunktion // Mathematische Zeitschrift. 1936. 41. P. 405–414.
S a p o g o v N. A. The problem of stability for a theorem of Cramer // Vestnik Leningrad. Univ. 1955. 10. P. 61–64.
I l ’i n V. V. On the quantitative stability of the Cramer theorem in a uniform metric in the case of equaly distributed random variables // Sov. Math. Dokl. 1981. 260. P. 525–526.
U s h a k o v N. G., U s h a k o v a A.P. Estimations of the decomposition stability into identical components // Statist. Probab. Let. 1995. 25. P. 221–229.
B o b k o v S. G., C h i s t y a k o v G.P., G ‥o t z e F. Stability problems in Cramer-type characterization in case of i.i.d. summands // Theory Probab. Appl. 2013. 57. P. 568–588.
Z o l o t a r e v V. M. Modern Theory of Summation of Random Variables. Utrecht: VSP, 1997.
S t e p h e n s M. A. EDF statistics for goodness of fit and some comparisons // J. Amer. Statist. Assoc. 1974. 69. P. 730–737.