Научная статья на тему 'НЕКОТОРЫЕ ПРОБЛЕМЫ ИЗУЧЕНИЯ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ СТУДЕНТАМИ МАТЕМАТИЧЕСКИХ СПЕЦИАЛЬНОСТЕЙ ПЕДАГОГИЧЕСКИХ УНИВЕРСИТЕТОВ'

НЕКОТОРЫЕ ПРОБЛЕМЫ ИЗУЧЕНИЯ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ СТУДЕНТАМИ МАТЕМАТИЧЕСКИХ СПЕЦИАЛЬНОСТЕЙ ПЕДАГОГИЧЕСКИХ УНИВЕРСИТЕТОВ Текст научной статьи по специальности «Экономика и бизнес»

CC BY
24
5
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА / СЛУЧАЙНАЯ ВЕЛИЧИНА / ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ / СТАТИСТИЧЕСКИЙ КРИТЕРИЙ

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Гончаренко Я.В., Працевитый Н.В.

В статье формулируются некоторые важные научные и прикладные проблемы математической статистики, предлагаются рекомендации по обновлению содержания курса математической статистики для студентов математических специальностей.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

SOME PROBLEMS OF STUDYING OF MATHEMATICAL STATISTICS BY STUDENTS OF MATHEMATICAL SPECIALITIES OF PEDAGOGICAL UNIVERSITIES

The article studies some important scientific and applied problems of mathematical statistics. Recommendations on modernization of the content of mathematical statistics course for students of mathematical specialities are offered.

Текст научной работы на тему «НЕКОТОРЫЕ ПРОБЛЕМЫ ИЗУЧЕНИЯ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ СТУДЕНТАМИ МАТЕМАТИЧЕСКИХ СПЕЦИАЛЬНОСТЕЙ ПЕДАГОГИЧЕСКИХ УНИВЕРСИТЕТОВ»

© СопеИагепко Уа., Рга18юу>1у1 М

ДЕЯК1 ПРОБЛЕМИ НАВЧАННЯ МАТЕМАТИЧНО1 СТАТИСТИКИ СТУДЕНТ1В МАТЕМАТИЧНИХ СПЕЦ1АЛЬНОСТЕЙ ПЕДАГОГ1ЧНИХ УН1ВЕРСИТЕТ1В

Я.В.Гончаренко, канд. фiз.-мат. наук, доцент, М.В.Працьовитий, доктор фiз.-мат. наук, професор, Нащональний педумверситет т. М.П.Драгоманова,

м. Ки1в, УКРА1НА

Формулюються деяш важливi науковi та прикладт проблеми математичног статистики, пропонуються рекомендацИ щодо оновлення змтту курсу математичног статистики для студентiв математичних спещальностей.

Ключов1 слова: математична статистика, випадкова величина, функщя розподшу, ста-тистичний критерт.

Постановка проблеми. Б.В.Гнеденко [3] дав наступне визначення статистики: «Статистика складаеться з трьох роздшв:

1) збiр статистичних даних, тобто в> домостей щодо окремих одиниць деяких масових сукупностей;

2) статистичне дослiдження отриманих даних, що полягае в з'ясуваннi тих законо-мрносгей, якi можуть бути всгановлет на основi даних масового спостереження;

3) розробка прийомв статистичного спостереження i аналiзу статистичних даних. Осганнш роздiл, власне кажучи, i е змiсгом математичноГ статистики».

В першш третинi ХХ ст. ^енсивно розвивалась параметрична статистика. Були сгворет методи, заснованi на аналiзi даних з параметричних амейсгв розпод^ л1в, що описуються кривими сiмейсгвa Пирсона. Нaйбiльш «популярним» був норма-льний (гaусiвський) розподш. Для перевiр-ки ппотез використовувались кригери Пирсона, Стьюдента, Фшера тощо. Були за-пропоновaнi метод максимально! правдо-подiбносгi, дисперсiйний aнaлiз, сформу-льовaнi основнi iдеi планування експери-менту.

Розроблену в першiй третит ХХ ст. теорiю aнaлiзу даних називають парамет-ричною статистикою, оскшьки Г! основний

об'ект вивчення - це вибiрки з розподiлiв, що описуються одним або невеликою кшь-юсгю пaрaметрiв. Нaйбiльш загальним е амейсгво кривих Шрсона, що задаеться чотирма параметрами. Добре вiдомi випад-ки, коли доцiльно викорисговувати пара-метричнi розподiли. Наприклад, якщо ймо-вiрнiснa модель передбачае сумування не-залежних випадкових величин, то суму описують нормальним розподiлом, якщо ж в моделi розглядаеться добуток таких величин, то результат наближаеться до лога-рифмiчно нормального розподiлу. Але, як правило, не можна вказати якихось ваго-мих причин, за якими розподiл результапв конкретних спостережень мае входити в те чи iнше параметричне сiмейсгво, i набли-ження реального розпод^ за допомогою деякого параметричного - чисто формальна операщя.

Саме з таких позицiй ще 1927 р. криги-кував параметричну статистику aкaдемiк АН СССР С.Н.Бернштейн в своГй доповiдi на Всеросшському з'Гзд мaтемaтикiв [1]. Однак ця теорiя, нажаль, до сьогоднi е основою викладання математичноГ статистики i продовжуе викорисговуватись в мaсi прикладних дослiджень.

Причиною i нaслiдком цього е велике вiдсгaвaння змiсгу вузiвських курсiв мате-

©

матично! статистики вщ сучасного розвит-ку теоретично! i прикладно! статистики. Так, зпдно думок деяких експерт1в [8], пщручники з математично! статистики за сво!м науковим рiвнем в основному вщпо-вiдають 40-60 рокам ХХ ст. Тому на цьому ж рiвнi залишаеться бшьш1сть прикладных i навiтъ деяю теоретичт роботи.

Витоки проблеми полягаютъ в тому, що на съогоднi вкоршилась думка, що ма-тематична статистика i прикладна статистика (або просто статистика) - це двi рiзнi науковi i навчалънi дисциплши. Курс математично! статистики складаеться в основному з доведення теорем, в основi курсiв прикладно! статистики - методология анал> зу даних та алгоритми розрахунюв, теоре-ми ж наводяться як обгрунтування цих ал-горитмв, часто навггь без доведень.

В контекстi тдготовки вчителя (викла-дача, мапстра) математики та економко-математичних дисциплiн необхщно акцен-тувати увагу i на теоретичнш, i на приклад-нш частинi статистики. Якщо теоретична частина на съогоднi представлена в навча-льних програмах на достатньому рiвнi, то прикладнiй не придiляетъся належно! ува-ги. Зрозумiло, що математична статистика е фундаментом для статистики прикладно! та багатьох шших дисциплш, але для того, щоб математична статистика насправдi стала фундаментальною основою освгти, в 11 навчаннi мають бути дотриманi наступи принципи:

1) зм^ дисциплiни мае охоплювати основт факти, моделi та методи, що скла-дають теоретичну основу для подальших дослiдженъ i застосувань;

2) при вивченш статистичних моделей та мет^в необхiдно вказувати (дослщжу-вати) !х межi та умови застосовносп, осно-внi типи прикладних задач, для яких даний клас методiв е найбiлъш ефективним;

3) необхщно встановити тiснi мiжпре-дметнi зв'язки мiж курсами «Теорiя ймовь рностей i математична статистика» та «Статистика» (або «Загальна теорiя статистики»). Перший курс як правило читають фаивщ математичних кафедр, якi встига-ють дати лише загальне уявлення про ос-

новнi поняття та задачi математично! статистики, при цьому увага викладачiв в основному зосереджена на внутршньо математичних проблемах, !х бiлъше щкавить доведення теорем, а не застосування стати-стичних методiв в задачах економжи, менеджменту, педагопки тощо. 1нший курс -«Статистика», як правило, входить в блок економчних дисциплiн. Як правило пщруч-ники i викладачi загально! статистики ви-користовують незначну частину знань з математично! статистики i надають студентам шформащю про ряд алгоритмiв, формул, методiв, часто не зупиняючись на пи-таннях: чому саме ц методи використову-ються для розв'язання даного типу задач?, де ще i при яких умовах можна використа-ти вивченi методи?, як зм^ться методи розв'язання, якщо умова задачi перестане задовольняти певним заданим умовам? та iн.

Таким чином, можна говорити, що ос-новними завданнями навчання математич-но! статистики студенпв математичних спе-цiалъностей педагопчних ушверситепв е:

1) сформувати цшсне уявлення про математичну статистику як теоретичну науку, !! основнi задачi i методи;

2) сформувати уявлення про матема-тичну статистику як прикладну науку, методи яко! грунтуються на фундаментальних фактах теори ймовiрностей;

3) озбро!ти майбутшх вчителiв та ви-кладачiв сучасними статистичними методами;

4) ознайомити з деякими проблемами теоретичних дослiдженъ та прикладних застосувань сучасно! статистики.

Мета статп: розглянути деяю важливi науковi та науково-прикладнi проблеми, на яю необхiдно звертати увагу студенпв у навчант математичнiй статистищ.

Виклад основного матер1алу. У ма-тематичнiй статистищ iснуе два тдходи до вихщних даних - детермшований та моде-лъно-ймовiрнiсний. В першому з них данi розглядаються окремо в кожному частин-ному випадку, без спроб пов' язати !х з де-якою загальною ситуацiею (моделлю). Цей пiдхiд властивий для прикладно! статистики. Наприклад, при аналiзi даних про виро-

бничу дiялънiстъ конкретного пщприемства за конкретний перiод часу тдраховуеться, кшьюсть робгтниюв, обсяг реалiзовано! продукци, рiзнi статт доходiв та витрат тощо. До детермшованих даних вщносять-ся рiзнi форми статистично! звiтностi, зок-рема, бухгалтерська, податкова тощо. Перевагою детермшованого пiдходу е вщсут-тсть будь-яких додаткових припущень про дат. Недолжами - неможливiстъ обгрун-тованого переносу висновюв з конкретно! ситуаци на iншi, !й аналогiчнi, а також не-можливiстъ оцiнити похибки отриманих резулътатiв.

Щоб подолати вказат недолiки, вико-ристовуеться моделъно-ймовiрнiсний пщ-хщ, зпдно з яким конкретт данi розгляда-ються як реалiзацi1 випадкових величин, векторiв, елементiв (значень функцш, ви-значених на ймовiрнiсному просторi).

Найбiлъш поширеною ймовiрнiсною моделлю породження даних е модель ви-падково! вибiрки. Зпдно з цiею моделлю данi х1, х2, ... , хп розглядаються як реалiза-цд незалежних однаково розподiлених випадкових елеменпв (величин, векторiв, множин або шших об'екпв нечислово! природи). При цьому часто припускаеться, що величини (елементи, вектори) мають нормальний розподш.

На основi сформульованих класичних припущень розроблено велику кшьюсть методiв математично! статистики. Однак в прикладних досшдженнях класичнi при-пущення е не вщповщають реальности Не-залежнiстъ результапв вимiрюванъ та !х однакова розподшенють як правило при-ймаеться за замовченням, тодi як в багатьох випадках !х значення е корельованими. Таким чином, методи математично! статистики досить часто використовуються поза межами !х обгрунтовано! застосовносп.

Розглянемо ситуащю, коли елементи вибiрки - числа. Модель описуеться функ-щею розподiлу елеменпв вибiрки. Що мо-жна сказати про цю функцш?

У навчальних курсах з теори ймов1рнос-тей i математично! статистики як правило розглядаються рiзнi параметричт амейст-ва розподiлiв числових випадкових вели-

чин. Зокрема, нормальний, експоненцш-ний, логарифмiчно нормальний, гамма-розподш тощо. Bci вони залежать вщ одного, двох або трьох параметрiв. Тому для повного опису розподiлу достатньо знайти або ощнити не бiльше трьох чисел. Це ду-же зручно. Тому параметрична теорiя математично! статистики детально розвинена i широко представлена в науковш та навча-льнiй лГтературГ

Нажаль, параметричнi сiмейства роз-подшв iснують лише на сторiнках тдруч-ниюв з теорГ! ймовiрностей i математично! статистики. Для коректного розв'язання багатьох прикладних задач доцГльно вико-ристовувати непараметричнi критерГ!, в яких розподГл результата спостереження може мати довшьний вигляд.

Розглянемо приклад, в якому вивчимо питання: насюльки реально визначити фу-нкцГю розподГлу з точтстю d < 0,01. С два тдходи до визначення функцГ! розподГлу результата спостережень: евристичний тдбГр з наступною перевГркою за допомо-гою критерГ!в згоди або виведення з деяко! ймовГртсно! моделГ.

Нехай за допомогою кригерш згоди Колмогорова перевГряеться ппотеза про те, що вибГрка взята з розподГлу F. НасправдГ ж вибГрка взята з розподГлу G, вщмшного вГд F. Нехай функцГ! розподГлу F i G задо-вольняють спГввГдношенню:

p(F, G) = sup | F(x) - G(x)|£d, (1)

x

тобто G мало вГдрГзняеться вГд F в розумш-нГ вГдстанГ Колмогорова.

Знайдемо при яких d ппотеза згоди з F буде прийматись не менш тж в 50% випадюв.

КритерГй згоди Колмогорова базуеться на статистищ:

4 =4nP(Fn, H), (2)

де вщстань р мГж функщями розподГлу визначаеться рГвтстю (1); H - та функ-цГя розподГлу, узгодженГсть з якою перевГряеться, а Fn - емтрична функщя розподГлу (тобто Fn (x) дорГвнюе долГ спостережень, менших х, в вибГрц обсягу n). Як показав А.Н.Колмогоров, функщя розподГлу

випадково1 величини 1n при зростанш об-сягу вибiрки n збiгаeться до деяко1 функцп розпод^ K (x), яку називають функцieю Колмогорова. При цьому K(1,36) = 0,95 i K(0,83) = 0,50 .

Оскшьки вибiрка взята з розпод^ G , то з ймовiрmсгю 0,50

P(F„, G) < ^ (3)

n

(при великих n). Тодi для досшджуваноi вибiрки з врахуванням нерiвностi (1) та не-рiвностi трикутника для ввдстат Колмогорова, а також симетричносп цiei вiдсганi, маемо

р( Fn, F) <r( F, G) + r(G, F) =

0 83

= p(Fn ,G) + p(F, G) < + d.

Якщо

0,83 e 1,36

тобто

IП -\1п

8у[п < 0,53 , то, зпдно формули (2), ппоте-за згоди приймаеться по меншш мiрi з тiею ж ймовiрнiсгю, з якою виконуеться нерiв-нiсгь (3), тобто з ймовiрнiсгю не меншою 0,50. Для 8 = 0,01 ця умова виконуеться при п < 2809. Таким чином, для визначен-ня функцii розподiлу з точтсгю 8 < 0,01 за допомогою критерiю згоди Колмогорова необхщно к1лька тисяч спосгережень, що для бшьшосп задач прикладноГ статистики нереально.

Конкретний вид функцii розподiлу може також виводитись з моделi поро-дження вiдповiдноi випaдковоi величини. Наприклад, з моделi сумування випливае нормальний розподш. Як правило, при ви-ведент викорисговуеться граничний пере-х1д. Так, з центрaльноi грaничноi теореми випливае, що сума незалежних випадкових величин може бути наближена нормальним розподшом. Однак, бiльш детальний aнaлiз, зокрема, за допомогою нерiвностi Беррi-Ессеена, показуе, що для гарантованого досягнення точност1 0,99 необх1дно бiльше 1500 доданюв. В реальних задачах таку к1-льк1сгь можна вказати не часто. Це означаемо в прикладнш зaдaчi теорiя дае мож-ливiсть лише сформулювати ппотезу про

вид функц1Т розподiлу, а перевiряти Гг необ-хiдно за допомогою реально! вибiрки обся-гом не менше полутора тисяч. Таким чином, в бшьшосп реальних сигуацш визна-чиги функцiю розподiлу з високою точню-тю неможливо.

П1дводячи п1дсумки, сформулюемо де-якi висновки та рекомендaцii щодо навчан-ня математичноГ статистики.

Навчання теор11 ймовiрностей, особливо студенпв «прикладних» (економ1чних, технiчних тощо) спещальносгей може бути зосереджено на випадку ск1нченного ймо-вiрнiсного простору. Несюнчент ймовiрнi-снi при цьому можуть розглядатись як зру-чнi математичт моделi, що дають можли-в^ь отримувати кориснi твердження для сюнченних просторiв. При такому пiдходi втрачае свою пaрaдоксaльнiсгь той емпiри-чно не раз перевiрений факт, що розподш похибок вимрювань, як правило не е гау-сiвським [9, 10].

Традицшно багато часу в навчальних курсах придiляеться оиАнкам максимально! прaвдоподiбностi. Однак тaкi ж гари асим-птотичнi властивосг^ мають так зват одно кроковi оцiнки, бшьш простi з обчислюва-льноГ точки зору [10]. Доцшьно було б включиги Гх в нaвчaльнi курси.

Доцiльно також придiлиги увагу ре-презентaтивнiй теор11 вимiрювaнь та кон-цепцii шкал вимiрювaнь. Необхiдно знайо-мити сгудент1в з визначеннями та основ-ними властивостями шкал найменувань, порядковоГ, iнтервaлiв, вiдношень, рiзниць, абсолютно!. Вказувати, якими алгоритмами статисгичного aнaлiзу даних можна корис-туватись в тiй чи iншiй шкал^ зокрема, для усереднення результат1в спосгережень.

Статисгичт мегоди дослiджень часто викорисговують сучaснi iнформaцiйнi тех-нолог1Г. Зокрема, ефективним е метод статисгичного моделювання (метод Монте-Карло), з яким необхiдно знайомиги сгуден-т1в.

Висновки. При вивченнi теор11 ймовь рностей та математичноГ статистики необхщно звертати увагу студенпв на наступи вaжливi пигання:

• вплив вдаилень вiд трaдицiйних

припущень ймовiрнiсно-статистичних моделей на властивост статистичних процедур;

• виправданiстъ використання асимп-тотичних теоретичних результата матема-тично! статистики при сюнченних обсягах виборок;

• формулювання та обгрунтування правил вибору одного з багатьох критерив для перевiрки конкретних ппотез;

• оргатзацш та проведення приклад-них робiт з використанням статистичних методiв.

Тiлъки через систему освiти можна пщ-няти рiвенъ масового застосування ймовiр-н1сно-статистичних методiв i скоротити вiдставання вiд сучасного рiвня розвитку теоретичних дослiдженъ.

1. Бернштейн С.Н. Современное состояние теории вероятностей и ее приложений. - В сб.: Труды Всероссийского съезда математиков в Москве 27 апреля - 4 мая 1927 г / С.Н.Бернш-тейн. - МЛ: ГИЗ, 1928. С.50-63.

2. Боровков А. А. Теория вероятностей /

А.А.Боровков. -М.: Наука, 1976. - 352 с.

3. Вероятность и математическая статистика: Энциклопедия /Гл. ред. Ю.ВЛрохоров. - М.: Большая Российская энциклопедия, 1999. -910 с.

4. Каган АМ.. Характеризационные задачи математической статистики / А.М.Каган, Ю.ВЛинник, С.Р.Рао. -М.: Наука, 1972. - 656с.

5. Кемени Дж.. Кибернетическое моделирование: Некоторые приложения / ДжКемени, Дж.Снелл. - М.: Советское радио, 1972. -192 с.

6. Крамер Г. Математические методы статистики /Г.Крамер. -М. : Мир, 1975. - 648 с.

7. Никитин Я.Ю. Асимптотическая эффективность непараметрических критериев / ЯЮНикитин. - М.: Наука, 1995. - 240 с

8. Орлов А.И. Устойчивость в социально-экономических моделях /АИ.Орлов. -М.: Наука, 1979. - 296 с.

9. Турчин В.Н. Теория вероятностей и математическая статистика / В.НТурчин. - Д.: Изд-во Днепропетровского нац. ун-та, 2008. - 656с.

10. Феллер В. Введение в теорию вероятностей и ее приложения. Т.2/В.Феллер. -М.: Мир, 1984. - 751 с.

Резюме. Гончаренко Я.В., Працевитый Н.В. НЕКОТОРЫЕ ПРОБЛЕМЫ ИЗУЧЕНИЯ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ СТУДЕНТАМИ МАТЕМАТИЧЕСКИХ СПЕЦИАЛЬНОСТЕЙ ПЕДАГОГИЧЕСКИХ УНИВЕРСИТЕТОВ. В статье формулируются некоторые важные научные и прикладные проблемы математической статистики, предлагаются рекомендации по обновлению содержания курса математической статистики для студентов математических специальностей.

Ключевые слова: математическая статистика, случайная величина, функция распределения, статистический критерий.

Abstract Goncharenko Ya., Pratsiovytyi M. SOME PROBLEMS OF STUDYING OF MATHEMATICAL STATISTICS BY STUDENTS OF MATHEMATICAL SPECIALITIES OF PEDAGOGICAL UNIVERSITIES. The article studies some important scientific and applied problems of mathematical statistics. Recommendations on modernization of the content of mathematical statistics course for students of mathematical specialities are offered.

Key words: mathematical statistics, random variable, function of distribution, statistical criterion.

Надшшла доредакцп 21.03.2011 р.

©

i Надоели баннеры? Вы всегда можете отключить рекламу.