Statistik əhəmiyyət səviyyəsi. Tibbi statistikanın əsas terminləri və anlayışları

FCC-nin hesablama praktikasında statistik etibarlılıq vacibdir. Əvvəllər qeyd olundu ki, eyni populyasiyadan bir çox nümunə seçilə bilər:

Əgər onlar düzgün seçilibsə, onda onların orta göstəriciləri və ümumi əhalinin göstəriciləri qəbul edilmiş etibarlılıq nəzərə alınmaqla reprezentativlik xətasının böyüklüyünə görə bir-birindən bir qədər fərqlənir;

Əgər onlar müxtəlif ümumi populyasiyalardan seçilərsə, aralarındakı fərq əhəmiyyətli olur. Nümunələrin müqayisəsi statistikada adətən nəzərə alınır;

Əgər onlar əhəmiyyətsiz, əhəmiyyətsiz, əhəmiyyətsiz fərqlənirlərsə, yəni əslində eyni ümumi əhaliyə aiddirlərsə, aralarındakı fərq statistik etibarsız adlanır.

statistik əhəmiyyətlidir seçmə fərqi əhəmiyyətli və əsaslı şəkildə fərqlənən, yəni müxtəlif ümumi populyasiyalara aid olan nümunədir.

FCC balı statistik etibarlılıq nümunələrdəki fərqlər bir çox praktiki problemlərin həlli deməkdir. Məsələn, yeni tədris metodlarının, proqramlarının, tapşırıqlar toplusunun, testlərin, nəzarət tapşırıqlarının tətbiqi onların eksperimental yoxlanılması ilə bağlıdır ki, bu da test qrupunun nəzarət qrupundan əsaslı şəkildə fərqləndiyini göstərməlidir. Buna görə də nümunələr arasında statistik əhəmiyyətli fərqin olub-olmamasını aşkar etmək üçün statistik əhəmiyyət meyarları adlanan xüsusi statistik üsullardan istifadə olunur.

Bütün meyarlar iki qrupa bölünür: parametrik və qeyri-parametrik. Parametrik meyarlar normal paylanma qanununun məcburi mövcudluğunu təmin edir, yəni. bu, normal qanunun əsas göstəricilərinin - arifmetik orta və standart kənarlaşma s-nin məcburi təyin edilməsinə aiddir. Parametrik meyarlar ən dəqiq və düzgündür. Qeyri-parametrik meyarlar nümunələrin elementləri arasında rütbə (sıra) fərqlərinə əsaslanır.

FCC təcrübəsində istifadə olunan statistik əhəmiyyətin əsas meyarları bunlardır: Tələbə testi və Fisher testi.

Tələbə meyarı kəşf edən ingilis alimi C. Gossetin (Student təxəllüsüdür) adını daşıyır bu üsul. Tələbənin t-testi parametrikdir, müqayisə üçün istifadə olunur mütləq göstəricilər nümunələri. Nümunələr ölçüdə fərqli ola bilər.

Tələbə meyarı belə müəyyən edilir.

1. Tələbə meyarını t aşağıdakı düstura görə tapırıq:


müqayisə edilən nümunələrin arifmetik vasitələri haradadır; t 1 , t 2 - müqayisə edilən nümunələrin göstəriciləri əsasında müəyyən edilmiş reprezentativlik xətaları.

2. FCC-də təcrübə göstərdi ki, idman işi üçün P = 0,95 balının etibarlılığını qəbul etmək kifayətdir.

Hesablamanın etibarlılığı üçün: P = 0,95 (a = 0,05), sərbəstlik dərəcələrinin sayı ilə

k \u003d n 1 + p 2 - 2 Əlavə 4-dəki cədvələ uyğun olaraq, meyarın sərhəd dəyərinin dəyərini tapırıq ( t gr).

3. Normal paylanma qanununun xassələrinə əsaslanaraq, Student kriteriyası t və t gr müqayisə edir.

Nəticə çıxarırıq:

əgər t t gr, onda müqayisə edilən nümunələr arasındakı fərq statistik əhəmiyyətlidir;

t t gr olarsa, onda fərq statistik əhəmiyyət kəsb etmir.

FCC sahəsində tədqiqatçılar üçün statistik əhəmiyyətin qiymətləndirilməsi konkret problemin həllində ilk addımdır: müqayisə edilən nümunələrin əsaslı şəkildə fərqlənib-fərqlənməməsi. Növbəti addım problemin şərti ilə müəyyən edilən bu fərqi pedaqoji nöqteyi-nəzərdən qiymətləndirməkdir.

Tələbə meyarının konkret misalda tətbiqini nəzərdən keçirin.

Misal 2.14. 18 nəfərdən ibarət bir qrup subyekt x i-dən əvvəl və sonra ürək dərəcəsi (bpm) üçün qiymətləndirildi. y i isinmə hərəkətləri.

Ürək dərəcəsi baxımından istiləşmənin effektivliyini qiymətləndirin. İlkin məlumatlar və hesablamalar cədvəldə təqdim olunur. 2.30 və 2.31.

Cədvəl 2.30

İstiləşmədən əvvəl ürək dərəcəsi məlumatlarının işlənməsi


Hər iki qrup üçün səhvlər üst-üstə düşdü, çünki nümunə ölçüləri bərabərdir (eyni qrup müxtəlif şərtlərdə öyrənilir) və standart kənarlaşmalar s x = s y = 3 bpm idi. Tələbə meyarının tərifinə keçək:

Hesabın etibarlılığını təyin edirik: Р= 0,95.

Sərbəstlik dərəcələrinin sayı k 1 \u003d n 1 + p 2 - 2 \u003d 18 + 18-2 \u003d 34. Əlavə 4-dəki cədvələ əsasən, tapırıq t gr= 2,02.

Statistik nəticə. t \u003d 11.62 və sərhəd t gr \u003d 2.02, sonra 11.62\u003e 2.02, yəni. t > t gr, buna görə də nümunələr arasındakı fərq statistik cəhətdən əhəmiyyətlidir.

pedaqoji nəticə. Müəyyən edilmişdir ki, ürək dərəcəsi baxımından qrupun isinmədən əvvəl və sonrakı vəziyyəti arasındakı fərq statistik cəhətdən əhəmiyyətlidir, yəni. əhəmiyyətli, əhəmiyyətli. Beləliklə, ürək dərəcəsi göstəricisinə görə, istiləşmənin təsirli olduğu qənaətinə gələ bilərik.

Fisher meyarı parametrikdir. Nümunələrin səpilmə nisbətlərini müqayisə edərkən istifadə olunur. Bu, bir qayda olaraq, idman işinin sabitliyi və ya praktikada funksional və texniki göstəricilərin sabitliyi baxımından müqayisə deməkdir. bədən tərbiyəsi və idman. Nümunələr müxtəlif ölçülərdə ola bilər.

Fisher kriteriyası aşağıdakı ardıcıllıqla müəyyən edilir.

1. Düsturla Fisher F meyarını tapın


burada , müqayisə edilən nümunələrin dispersiyalarıdır.

Fisher kriteriyasının şərtləri düsturun sayında olmasını təmin edir F böyük bir fərq var, yəni. F həmişə birdən böyükdür.

Hesabın etibarlılığını təyin edirik: P = 0,95 - və hər iki nümunə üçün sərbəstlik dərəcələrinin sayını təyin edirik: k 1 = n 1 - 1, k 2 = n 2 - 1.

Əlavə 4-ün cədvəlinə əsasən F meyarının sərhəd qiymətini tapırıq gr.

F və F meyarlarının müqayisəsi gr aşağıdakı nəticələr çıxarmağa imkan verir:

əgər F > F gr, onda nümunələr arasındakı fərq statistik əhəmiyyətlidir;

əgər F< F гр, то различие между выборками статически недо­стоверно.

Konkret bir misal götürək.

Misal 2.15. İki qrup həndbolçuları təhlil edək: x i (n 1= 16 nəfər) və y i (n 2 = 18 nəfər). Bu idmançı qrupları topun qapıya atılması zamanı dəf etmə vaxtı(ları) üçün öyrənilmişdir.

İtirmə dərəcələri eynidirmi?

İlkin məlumatlar və əsas hesablamalar Cədvəldə təqdim olunur. 2.32 və 2.33.

Cədvəl 2.32

Birinci qrup həndbolçuların itələmə göstəricilərinin işlənməsi


Fisher kriteriyasını təyin edək:





Əlavə 6-nın cədvəlində təqdim olunan məlumatlara əsasən Fgr tapırıq: Fgr = 2.4

Diqqət yetirək ki, Əlavə 6-nın cədvəlində yaxınlaşdıqda həm böyük, həm də kiçik dispersiyanın sərbəstlik dərəcələrinin nömrələrinin sadalanması böyük rəqəmlər kobudlaşır. Beləliklə, daha böyük bir dispersiyanın sərbəstlik dərəcələrinin sayı bu ardıcıllıqla aşağıdakı kimidir: 8, 9, 10, 11, 12, 14, 16, 20, 24 və s., və daha kiçik bir - 28, 29, 30, 40, 50 və s. d.

Bu, nümunə ölçüsünün artması ilə F-testindəki fərqlərin azalması və orijinal məlumatlara yaxın olan cədvəl dəyərlərindən istifadə edilə bilməsi ilə izah olunur. Beləliklə, misal 2.15 =17 yoxdur və biz ona ən yaxın olan k = 16 qiymətini götürə bilərik, buradan Fgr = 2.4 alırıq.

Statistik nəticə. Fisher testi F= 2.5 > F= 2.4 olduğundan nümunələr statistik cəhətdən əhəmiyyətlidir.

pedaqoji nəticə. Hər iki qrupun həndbolçularının qapısına topu atarkən itələmə vaxtının (zamanlarının) dəyərləri əhəmiyyətli dərəcədə fərqlənir. Bu qruplar fərqli hesab edilməlidir.

Əlavə araşdırmalar bu fərqin səbəbinin nə olduğunu göstərməlidir.

Misal 2.20.(nümunənin statistik əhəmiyyəti haqqında ). Məşqin əvvəlində işarənin verilməsindən topa qovuşmasına qədər olan vaxt (lər) x i , sonunda isə i olarsa, futbolçunun ixtisası artıbmı?

İlkin məlumatlar və əsas hesablamalar cədvəldə verilmişdir. 2.40 və 2.41.

Cədvəl 2.40

Məşqin əvvəlində siqnal verməkdən topa vurmağa qədər vaxt göstəricilərinin işlənməsi


Tələbə meyarına uyğun olaraq göstəricilər qrupları arasındakı fərqi müəyyən edək:

Etibarlılıq P \u003d 0.95 və sərbəstlik dərəcələri ilə k \u003d n 1 + n 2 - 2 \u003d 22 + 22 - 2 \u003d 42, Əlavə 4-dəki cədvələ uyğun olaraq tapırıq t gr= 2.02. t = 8.3 > olduğundan t gr= 2.02 - fərq statistik əhəmiyyətlidir.

Fişer meyarına uyğun olaraq göstərici qrupları arasındakı fərqi müəyyən edək:


Əlavə 2-nin cədvəlinə əsasən etibarlılıq P = 0,95 və sərbəstlik dərəcələri k = 22-1 = 21 olduqda F gr = 21. F = 1,53 olduğundan< F гр = = 2,1, различие в рассеивании исходных данных статистически недостоверно.

Statistik nəticə. Orta hesaba görə, göstəricilər qrupları arasındakı fərq statistik əhəmiyyətlidir. Dispersiya (dispersiya) baxımından göstəricilər qrupları arasındakı fərq statistik əhəmiyyət kəsb etmir.

pedaqoji nəticə. Futbolçunun ixtisası xeyli yaxşılaşıb, lakin onun ifadəsinin sabitliyinə diqqət yetirilməlidir.

İşə hazırlıq

Bundan əvvəl laboratoriya işi"İdman metrologiyası" fənni üzrə bütün tələbələrə təhsil qrupu hər birində 3-4 tələbədən ibarət işçi komandalar yaratmaq lazımdır, bütün laboratoriya işlərinin iş tapşırığını birgə yerinə yetirmək.

İşə hazırlıq zamanı tövsiyə olunan ədəbiyyatın müvafiq bölmələri (bu təlimatların 6-cı bölməsinə baxın) və mühazirə qeydləri ilə tanış olun. Bu laboratoriya üçün 1-ci və 2-ci bölmələri, eləcə də onun üçün iş tapşırığını öyrənin (bölmə 4).

Hesabat forması hazırlayın A4 yazı kağızının standart vərəqlərində və iş üçün lazım olan materialları içinə qoyun.

Hesabatda olmalıdır :

Başlıq səhifəsi kafedra (Böyük Britaniya və TR), təhsil qrupu, tələbənin soyadı, adı, atasının adı, laboratoriya işinin nömrəsi və adı, tamamlanma tarixi, habelə soyadı, elmi dərəcəsi, elmi adı və vəzifəsi göstərilməklə işi qəbul edən müəllim haqqında;

İşin məqsədi;

Hesablamaların aralıq və yekun nəticələrini izah edən ədədi dəyərləri olan düsturlar;

Ölçülmüş və hesablanmış dəyərlərin cədvəlləri;

Tapşırıq üçün tələb olunan qrafik material;

İş tapşırığının hər bir mərhələsinin nəticələri və ümumiyyətlə yerinə yetirilən işlərə dair qısa nəticələr.

Bütün qrafiklər və cədvəllər rəsm alətlərindən istifadə etməklə dəqiqliklə çəkilir. Şərti qrafik və əlifba təyinatları GOST-lara uyğun olmalıdır. Hesabatın kompüter (kompüter) texnologiyasından istifadə etməklə tərtib edilməsinə icazə verilir.

İş tapşırığı

Bütün ölçmələri həyata keçirməzdən əvvəl komandanın hər bir üzvü istifadə qaydalarını öyrənməlidir idman oyunu Tədqiqatın aşağıdakı mərhələləri üçün zəruri olan 7-ci əlavədə verilmiş dartlar.

I - tədqiqat mərhələsi“Briqadanın hər bir üzvü tərəfindən Dart idman oyununun hədəfinə vurulması nəticələrinin meyar üzrə normal paylanma qanununa uyğunluğu üzrə öyrənilməsi χ 2 Pearson və üç siqma testi

1. (şəxsi) sürətinizi və hərəkətlərinizin koordinasiyasını ölçün (sınayın), Darts idman oyununun dairəvi hədəfinə 30-40 dəfə dart atmaqla.

2. Ölçmələrin nəticələri (testlər) x i(nöqtələrlə) variasiya seriyası şəklində düzün və cədvəl 4.1-ə daxil edin (sütunlar , bütün lazımi hesablamaları yerinə yetirin, lazımi cədvəlləri doldurun və əldə edilmiş empirik paylanmanın normal paylanma qanununa uyğunluğu barədə müvafiq nəticələr çıxarın; 7-10-cu səhifələrdə bu təlimatın 2-ci bölməsində verilmiş oxşar hesablamalar, cədvəllər və nümunə 2.12-nin nəticələrinə bənzətməklə.

Cədvəl 4.1

Subyektlərin hərəkət sürətinin və koordinasiyasının normal paylanma qanununa uyğunluğu

№ p / p dairəvi
Ümumi

II - tədqiqat mərhələsi

"Bir briqada üzvlərinin ölçmələrinin nəticələrinə əsasən təhsil qrupunun bütün tələbələrinin Dart idman oyununun hədəfinə vurulan ümumi əhalinin orta göstəricilərinin qiymətləndirilməsi"

Tədris qrupunun bütün üzvlərinin Dart idman oyununun hədəfini vurmasının nəticələrinə əsasən (sinf jurnalının tədris qrupunun siyahısına uyğun olaraq) təhsil qrupunun bütün tələbələrinin hərəkətlərinin sürətinin və əlaqələndirilməsinin orta göstəricilərini qiymətləndirin. Bu laboratoriya işində tədqiqatın ilk mərhələsində əldə edilən qrup.

1. Sürətin ölçülməsi və hərəkətlərin əlaqələndirilməsinin nəticələrini sənədləşdirin idman oyununun dairəvi hədəfinə dart atarkən Komandanızın bütün üzvlərinin (2 - 4 nəfər) dartları ümumi əhali arasından ölçmə nəticələrinin seçimidir (təhsil qrupunun bütün tələbələrinin ölçmə nəticələri - məsələn, 15 nəfər), onları ikinci və üçüncü sütunlara daxil etməklə, cədvəl 4.2.

Cədvəl 4.2

Hərəkətlərin sürəti və əlaqələndirilməsi göstəricilərinin işlənməsi

briqada üzvləri

№ p / p
Ümumi

Cədvəl 4.2 altında başa düşülməlidir , orta hesabla uyğunlaşdı (cədvəl 4.1-ə uyğun olaraq hesablamaların nəticələrinə baxın) komandanızın üzvləri , tədqiqatın birinci mərhələsində əldə edilmişdir. Qeyd edək ki, adətən, cədvəl 4.2-də tədqiqatın birinci mərhələsində komandanın bir üzvü tərəfindən alınan ölçmə nəticələrinin hesablanmış orta dəyəri var , çünki komandanın müxtəlif üzvlərinin ölçmə nəticələrinin üst-üstə düşmə ehtimalı çox azdır. Sonra, adətən dəyərlər bir sütunda sətirlərin hər biri üçün cədvəl 4.2 - 1-ə bərabərdir, A sətirində "Cəmi » sütunları « », yazılır komandanızın üzvlərinin sayı.

2. Cədvəl 4.2-ni doldurmaq üçün bütün zəruri hesablamaları, eləcə də bu sənədin 2-ci bölməsində verilmiş 2.13-cü misaldakı hesablamalara və nəticələrə oxşar digər hesablamaları və nəticələri yerinə yetirin. metodoloji inkişafı 13-14-cü səhifələrdə. Nümayəndəliyin səhvini hesablayarkən nəzərə alınmalıdır "m" bu metodik inkişafın 13-cü səhifəsində verilmiş 2.4 düsturundan istifadə etmək lazımdır, çünki nümunə kiçikdir (n və ümumi əhalinin elementlərinin sayı N məlumdur və təhsil qrupundakı tələbələrin sayına bərabərdir. , təhsil qrupunun jurnalının siyahısına uyğun olaraq.

III - tədqiqat mərhələsi

Tələbə meyarından istifadə edərək komandanın hər bir üzvü tərəfindən "Sürət və hərəkətlərin koordinasiyası" baxımından istiləşmənin effektivliyinin qiymətləndirilməsi

Bu laboratoriya işinin tədqiqinin birinci mərhələsində komandanın hər bir üzvü tərəfindən "Sürət və hərəkətlərin koordinasiyası", Tələbə meyarından istifadə etməklə - empirik paylanma qanununun normal paylanma qanununa statistik etibarlılığının parametrik meyarı.

… Ümumi

2. dispersiya və Şimali Qazaxıstan , isinmə nəticələrinə əsasən "Sürət və hərəkətlərin koordinasiyası" göstəricisinin ölçmə nəticələri, cədvəl 4.3-də verilmişdir, (bu metodoloji inkişafın 16-cı səhifəsində 2.14-cü misalın 2.30-cu cədvəlindən dərhal sonra verilmiş oxşar hesablamalara baxın).

3. İşçi qrupunun hər bir üzvü istiləşmədən sonra (şəxsi) sürətinizi və hərəkətlərin koordinasiyasını ölçün (sınayın),

… Ümumi

5. Orta hesablamalar aparın dispersiya və Şimali Qazaxıstan ,istiləşmədən sonra "Sürət və hərəkətlərin koordinasiyası" göstəricisinin ölçülməsinin nəticələri, cədvəl 4.4-də verilmişdir, isinmənin nəticələrinə əsasən ölçmələrin ümumi nəticəsini yazın (bu metodoloji inkişafın 17-ci səhifəsində 2.14-cü misalın 2.31-ci cədvəlindən dərhal sonra verilmiş oxşar hesablamalara baxın).

6. 16-17-ci səhifələrdə bu metodik inkişafın 2-ci bölməsində verilmiş 2.14-cü misaldakı hesablamalar və nəticələrə bənzər bütün zəruri hesablamaları və nəticələri yerinə yetirin. Nümayəndəliyin səhvini hesablayarkən nəzərə alınmalıdır "m" bu metodoloji inkişafın 12-ci səhifəsində verilmiş 2.1 düsturundan istifadə etmək lazımdır, çünki nümunə n, populyasiyanın elementlərinin sayı isə N ( məlum deyil.

IV - tədqiqat mərhələsi

Fisher meyarından istifadə edərək komandanın iki üzvünün "Sürət və hərəkətlərin koordinasiyası" göstəricilərinin vahidliyinin (sabitliyinin) qiymətləndirilməsi

Bu laboratoriya işinin tədqiqatının üçüncü mərhələsində əldə edilmiş ölçmə nəticələrinə görə, Fişer meyarından istifadə edərək komandanın iki üzvünün "Sürət və hərəkətlərin koordinasiyası" göstəricilərinin vahidliyini (sabitliyini) qiymətləndirin.

Bunu etmək üçün aşağıdakıları edin.

Cədvəl 4.3 və 4.4-ün məlumatlarından istifadə edərək, tədqiqatın üçüncü mərhələsində əldə edilmiş bu cədvəllər üçün dispersiyaların hesablanması nəticələri, habelə idman göstəricilərinin vahidliyini (sabitliyini) qiymətləndirmək üçün Fişer meyarının hesablanması və tətbiqi metodologiyası, bu metodik inkişafın 18-19-cu səhifələrində 2.15-ci misalda verilmiş müvafiq statistik və pedaqoji nəticələr çıxarın.

V - tədqiqat mərhələsi

İstiləşmədən əvvəl və sonra komandanın bir üzvünün "Sürət və hərəkətlərin koordinasiyası" göstərici qruplarının qiymətləndirilməsi

Tapşırıq 3. Beş məktəbəqədər uşağa test təqdim olunur. Hər tapşırığın həlli üçün vaxt müəyyən edilir. Testin ilk üç tapşırığını həll etmək vaxtı arasında statistik əhəmiyyətli fərqlər olacaqmı?

subyektlərin sayı

İstinad materialı

Bu tapşırıq dispersiya təhlili nəzəriyyəsinə əsaslanır. Ümumi halda dispersiya təhlilinin vəzifəsi eksperimentin nəticəsinə əhəmiyyətli təsir göstərən amilləri müəyyən etməkdir. Nümunələrin sayı ikidən çox olarsa, dispersiya təhlili bir neçə nümunənin ortalarını müqayisə etmək üçün istifadə edilə bilər. Bu məqsədlə birtərəfli dispersiya təhlili xidmət edir.

Qarşıya qoyulan vəzifələri həll etmək üçün aşağıdakılar qəbul edilir. Əgər amillərin təsiri zamanı optimallaşdırma parametrinin əldə edilmiş qiymətlərinin dəyişmələri amillərin təsiri olmadıqda nəticələrin dispersiyalarından fərqlənirsə, belə bir amil əhəmiyyətli hesab olunur.

Məsələnin tərtibindən göründüyü kimi, burada statistik fərziyyələrin yoxlanılması üsullarından, yəni iki empirik variasiyanın yoxlanılması problemindən istifadə olunur. Buna görə də dispersiya təhlili dispersiyaların Fişer kriteriyası ilə yoxlanılmasına əsaslanır. Bu tapşırıqda altı məktəbəqədər uşağın hər biri tərəfindən testin ilk üç tapşırığını həll etmə vaxtı arasındakı fərqlərin statistik əhəmiyyətli olub olmadığını yoxlamaq lazımdır.

Sıfır (əsas) fərziyyə H o adlanır. e-nin mahiyyəti müqayisə edilən parametrlər arasındakı fərqin sıfır olması (bu səbəbdən fərziyyənin adı - sıfır) və müşahidə edilən fərqlərin təsadüfi olması fərziyyəsinə endirilir.

Rəqabətli (alternativ) fərziyyə H 1 adlanır və sıfıra ziddir.

Həll:

α = 0,05 əhəmiyyət səviyyəsində dispersiya təhlili metodundan istifadə edərək, altı məktəbəqədər uşaqda testin ilk üç tapşırığını həll etmə vaxtı arasında statistik əhəmiyyətli fərqlərin mövcudluğu haqqında sıfır fərziyyəni (Hо) yoxlayacağıq.

Üç test tapşırığının hər birini həll etmək üçün orta vaxt tapdığımız tapşırıq şərtləri cədvəlini nəzərdən keçirin

subyektlərin sayı

Faktor səviyyələri

Testin ilk tapşırığını həll etmək vaxtıdır (san.).

Testin ikinci tapşırığını həll etmək vaxtıdır (san.).

Testin üçüncü tapşırığını həll etmək vaxtıdır (san.).

Qrup orta

Ümumi ortanın tapılması:

Hər bir testin vaxt fərqlərinin əhəmiyyətini nəzərə almaq üçün ümumi seçmə dispersiya iki hissəyə bölünür, birincisi faktorial, ikincisi isə qalıq adlanır.

Düsturdan istifadə edərək variantın ümumi ortadan kvadrat kənara çıxmalarının ümumi cəmini hesablayın

və ya , burada p - test tapşırıqlarının həlli üçün vaxt ölçmələrinin sayı, q - mövzuların sayı. Bunu etmək üçün, kvadratlar seçimini bir cədvəl hazırlayacağıq

subyektlərin sayı

Faktor səviyyələri

Testin ilk tapşırığını həll etmək vaxtıdır (san.).

Testin ikinci tapşırığını həll etmək vaxtıdır (san.).

Testin üçüncü tapşırığını həll etmək vaxtıdır (san.).

Sizcə, "can yoldaşınızı" xüsusi, mənalı edən nədir? Bu, onun (onun) şəxsiyyəti ilə, yoxsa bu insana olan hisslərinizlə bağlıdır? Yoxsa sadə bir faktla, tədqiqatlar göstərir ki, sizin bəyəndiyiniz təsadüfi fərziyyənin ehtimalı 5%-dən azdır? Son ifadəni etibarlı hesab etsək, uğurlu tanışlıq saytları prinsipcə mövcud olmazdı:

Siz split test və ya saytınızın hər hansı digər təhlilini apararkən, "statistik əhəmiyyətin" səhv başa düşülməsi nəticələrin yanlış təfsirinə səbəb ola bilər və buna görə də səhv hərəkətlər dönüşüm optimallaşdırma prosesində. Bu, hər hansı bir mövcud sənayedə gündəlik həyata keçirilən minlərlə digər statistik testlərə aiddir.

“Statistik əhəmiyyətin” nə olduğunu başa düşmək üçün özünüzü bu terminin yaranma tarixinə qərq etmək, onu bilmək lazımdır. əsl məna və bu "yeni" köhnə anlayışın tədqiqatınızın nəticələrini düzgün şərh etməyə necə kömək edəcəyini anlayın.

Bir az tarix

Bəşəriyyət uzun əsrlər boyu müəyyən problemləri həll etmək üçün statistikadan istifadə etsə də, müasir anlayış statistik əhəmiyyət, fərziyyə testi, təsadüfiləşdirmə və hətta təcrübələrin dizaynı (Təcrübələrin Dizaynı (DOE) yalnız 20-ci əsrin əvvəllərində formalaşmağa başladı və Ser Ronald Fisherin adı ilə ayrılmaz şəkildə bağlıdır (Sir Ronald Fisher, 1890-1962). ):

Ronald Fisher təkamülçü bioloq və statistik idi, təkamülün öyrənilməsinə xüsusi ehtirası vardı. təbii seleksiya heyvanda və flora. Şöhrətli karyerası ərzində o, bu gün də istifadə etdiyimiz bir çox faydalı statistik alətlər hazırladı və populyarlaşdırdı.

Fisher dominantlıq, mutasiya və genetik variasiya kimi biologiyada prosesləri izah etmək üçün inkişaf etdirdiyi üsullardan istifadə etdi. Veb resurslarının məzmununu optimallaşdırmaq və təkmilləşdirmək üçün bu gün eyni alətləri tətbiq edə bilərik. Bu analiz vasitələrinin yaradıldığı zaman belə mövcud olmayan obyektlərlə işləmək üçün istifadə oluna bilməsi olduqca təəccüblü görünür. Eyni dərəcədə təəccüblüdür ki, insanlar ən mürəkkəb hesablamaları kalkulyatorlar və ya kompüterlər olmadan aparırdılar.

Statistik eksperimentin nəticələrini doğru olma ehtimalının yüksək olduğu kimi təsvir etmək üçün Fisher əhəmiyyət sözündən istifadə etdi.

Fişerin ən maraqlı inkişaflarından biri də “cinsi oğul” fərziyyəsidir. Bu nəzəriyyəyə görə, qadınlar azğın kişilərə (gəzənlərə) üstünlük verirlər, çünki bu, həmin kişilərdən doğulan oğulların eyni meylə malik olmasına və daha çox nəslini dünyaya gətirməsinə imkan verəcək (qeyd edək ki, bu, sadəcə bir nəzəriyyədir).

Ancaq heç kim, hətta parlaq elm adamları da səhv etməkdən qorunmur. Fişerin qüsurları bu günə qədər mütəxəssisləri narahat edir. Ancaq Albert Eynşteynin sözlərini xatırlayın: "Heç vaxt səhv etməyən heç vaxt yeni bir şey yaratmayıb".

Növbəti nöqtəyə keçməzdən əvvəl yadda saxlayın ki, statistik əhəmiyyət test nəticələrindəki fərqin o qədər böyük olduğu bir vəziyyətdir ki, bu fərq təsadüfi amillərin təsiri ilə izah edilə bilməz.

Sizin hipoteziniz nədir?

“Statistik cəhətdən əhəmiyyətli”nin nə demək olduğunu başa düşmək üçün əvvəlcə “hipoteza testinin” nə olduğunu başa düşməlisiniz, çünki iki termin bir-biri ilə sıx bağlıdır.
Hipoteza sadəcə bir nəzəriyyədir. Bir nəzəriyyə hazırladıqdan sonra kifayət qədər sübut toplamaq üçün prosedur yaratmalı və əslində bu sübutları toplamalı olacaqsınız. İki növ hipotez var.

Alma və ya portağal - hansı daha yaxşıdır?

Boş hipotez

Bir qayda olaraq, bu yerdə çoxları çətinlik çəkirlər. Nəzərə almaq lazımdır ki, sıfır fərziyyə sübuta ehtiyacı olan bir şey deyil, məsələn, siz saytda müəyyən dəyişikliyin konversiya artımına səbəb olacağını sübut edirsiniz, əksinə. Null hipotezi, saytda hər hansı bir dəyişiklik etsəniz, heç bir şey olmayacağını söyləyən bir nəzəriyyədir. Tədqiqatçının məqsədi isə bu nəzəriyyəni sübut etmək deyil, təkzib etməkdir.

Cinayətin açılması təcrübəsinə müraciət etsək, burada müstəntiqlər də cinayəti törədənin kimliyi ilə bağlı fərziyyə irəli sürürlər, sıfır fərziyyə təqsirsizlik prezumpsiyası deyilən, təqsirləndirilən şəxsin günahı məhkəmədə sübuta yetirilməyənə qədər təqsirsiz hesab edilməsi konsepsiyası formasını alır.

Əgər sıfır fərziyyə iki obyektin öz xassələrinə görə bərabər olmasıdırsa və siz onlardan birinin hələ də daha yaxşı olduğunu sübut etməyə çalışırsınızsa (məsələn, A B-dən yaxşıdır), alternativin xeyrinə sıfır fərziyyədən imtina etməlisiniz. bir. Məsələn, bu və ya digər konvertasiya optimallaşdırma alətini bir-birinizlə müqayisə edirsiniz. Sıfır fərziyyədə onların hər ikisi hədəfə eyni təsir göstərir (yaxud heç bir təsiri yoxdur). Alternativ olaraq onlardan birinin təsiri daha yaxşıdır.

Alternativ fərziyyəniz B - A > 20% kimi ədədi dəyərdən ibarət ola bilər. Bu halda sıfır fərziyyə və alternativ aşağıdakı formanı ala bilər:

Alternativ fərziyyənin başqa adı tədqiqat hipotezidir, çünki tədqiqatçı həmişə bu xüsusi fərziyyəni sübut etməkdə maraqlıdır.

Statistik əhəmiyyət və "p" dəyəri

Ronald Fişerə və onun statistik əhəmiyyət anlayışına qayıdaq.

İndi sıfır fərziyyə və alternativiniz olduğuna görə birini sübut edib digərini necə təkzib edə bilərsiniz?

Statistika öz təbiətinə görə müəyyən bir əhalinin (nümunə) öyrənilməsini nəzərdə tutduğundan, əldə etdiyiniz nəticələrdən heç vaxt 100% əmin ola bilməzsiniz. Aydın bir misal: Seçkilərin nəticələri çox vaxt ilkin sorğuların və hətta çıxış hovuzlarının nəticələrindən fərqlənir.

Doktor Fisher təcrübənizin uğurlu olub-olmadığını sizə bildirəcək bir bölücü xətt yaratmaq istəyirdi. Güvən indeksi belə yarandı. Etibarlılıq "mənalı" hesab etdiyimiz və olmayanı söyləmək üçün götürdüyümüz səviyyədir. Etibar indeksi "p" 0,05 və ya daha azdırsa, nəticələr əhəmiyyətlidir.

Narahat olmayın, əslində göründüyü qədər qarışıq deyil.

Qauss ehtimal paylanması. Kenarlarda - dəyişənin daha az ehtimal olunan dəyərləri, mərkəzdə - ən çox ehtimal olunur. P-balı (yaşıl kölgəli sahə) müşahidə edilən nəticənin təsadüfən baş vermə ehtimalıdır.

Normal ehtimal paylanması (Qauss paylanması) hamısının bir təmsilidir mümkün dəyərlər qrafikdə bəzi dəyişənlər (yuxarıdakı şəkildə) və onların tezlikləri. Tədqiqatınızı düzgün aparsanız və sonra aldığınız bütün cavabları qrafikdə tərtib etsəniz, məhz bu paylanmanı əldə edəcəksiniz. Normal paylanmaya görə, oxşar cavabların böyük bir faizini alacaqsınız və qalan variantlar qrafikin kənarlarında (sözdə "quyruqlar") yerləşəcəkdir. Kəmiyyətlərin belə paylanması təbiətdə tez-tez rast gəlinir, buna görə də "normal" adlanır.

Nümunə və test nəticələrinə əsaslanan tənlikdən istifadə edərək, nəticələrin nə qədər sapdığını bildirən "test statistikası" adlanan şeyi hesablaya bilərsiniz. O, həmçinin sıfır fərziyyənin doğru olmasına nə qədər yaxın olduğunuzu sizə xəbər verəcəkdir.

Başınızı aşağı salmaq üçün statistik əhəmiyyəti hesablamaq üçün onlayn kalkulyatorlardan istifadə edin:

Belə kalkulyatorların bir nümunəsi

"P" hərfi sıfır fərziyyənin doğru olma ehtimalını ifadə edir. Əgər rəqəm kiçikdirsə, bu, test qrupları arasında fərqi göstərəcək, sıfır fərziyyə isə onların eyni olmasıdır. Qrafik olaraq, bu, test statistikanızın zəng paylamanızın quyruqlarından birinə daha yaxın olduğu kimi görünəcək.

Doktor Fişer nəticələr üçün etimad həddini p ≤ 0,05 səviyyəsində təyin etmək qərarına gəldi. Bununla belə, bu bəyanat da mübahisəlidir, çünki iki çətinliyə səbəb olur:

1. Birincisi, sıfır fərziyyənin yanlış olduğunu sübut etməyiniz, alternativ hipotezi sübut etdiyiniz demək deyil. Bütün bu əhəmiyyət yalnız o deməkdir ki, siz nə A, nə də B-ni sübut edə bilməyəcəksiniz.

2. İkincisi, əgər p-qiyməti 0,049-a bərabərdirsə, bu, sıfır hipotezinin ehtimalının 4,9% olacağı anlamına gələcək. Bu, eyni zamanda, test nəticələrinizin eyni anda həm etibarlı, həm də yanlış ola biləcəyini ifadə edə bilər.

Siz p-dəyərindən istifadə edə bilərsiniz, ya yox, lakin sonra hər bir fərdi halda sıfır fərziyyənin ehtimalını hesablamalı və onun planlaşdırdığınız və sınaqdan keçirdiyiniz dəyişiklikləri etməmək üçün kifayət qədər böyük olub-olmamasına qərar verməli olacaqsınız.

Bu gün statistik testin aparılması üçün ən ümumi ssenari faktiki testi keçirməzdən əvvəl p ≤ 0.05 əhəmiyyət həddi təyin etməkdir. Nəticələri yoxlayarkən p-dəyərini diqqətlə yoxlamağı unutmayın.

Səhvlər 1 və 2

O qədər vaxt keçdi ki, statistik əhəmiyyət ölçüsündən istifadə edərkən baş verə biləcək səhvlər hətta öz adlarını aldı.

Səhv 1 (Tip 1 Səhvlər)

Yuxarıda qeyd edildiyi kimi, p-dəyəri 0,05 sıfır hipotezinin doğru olmasının 5% şansı deməkdir. Bunu etməsəniz, 1 nömrəli səhvə yol vermiş olursunuz. Nəticələr göstərir ki, yeni vebsaytınız dönüşüm nisbətlərini artırıb, lakin 5% ehtimalı yoxdur.

Səhv 2 (Növ 2 Səhvlər)

Bu xəta 1-ci xətanın əksidir: siz boş hipotezi yanlış olduqda qəbul edirsiniz. Məsələn, test nəticələri sizə bildirir ki, saytda edilən dəyişikliklər heç bir təkmilləşdirmə gətirməyib, halbuki dəyişikliklər olub. Nəticədə: performansınızı artırmaq fürsətini əldən verirsiniz.

Bu xəta qeyri-kafi nümunə ölçüləri olan testlərdə tez-tez olur, ona görə də yadda saxlayın ki, nümunə nə qədər böyük olsa, nəticə bir o qədər etibarlı olar.

Nəticə

Bəlkə də tədqiqatçılar arasında heç bir termin statistik əhəmiyyəti qədər populyar deyil. Test nəticələri statistik cəhətdən əhəmiyyətli hesab edilmədikdə, nəticələr dönüşüm nisbətlərinin artmasından şirkətin dağılmasına qədər dəyişir.

Və marketoloqlar öz resurslarını optimallaşdırarkən bu termindən istifadə etdikləri üçün bunun həqiqətən nə demək olduğunu bilməlisiniz. Test şərtləri dəyişə bilər, lakin nümunə ölçüsü və müvəffəqiyyət meyarları həmişə vacibdir. Bunu yadda saxla.

Statistikada əhəmiyyət səviyyəsidir mühüm göstəricidir, alınan (proqnozlaşdırılan) məlumatların dəqiqliyinə, həqiqətinə inam dərəcəsini əks etdirən. Konsepsiyadan geniş istifadə olunur müxtəlif sahələr: tutmaqdan sosioloji tədqiqat, elmi fərziyyələrin statistik sınağına.

Tərif

Statistik əhəmiyyətlilik səviyyəsi (və ya statistik əhəmiyyətli nəticə) öyrənilən göstəricilərin təsadüfi baş vermə ehtimalının nə qədər olduğunu göstərir. Hadisənin ümumi statistik əhəmiyyəti p-qiyməti (p-səviyyəsi) ilə ifadə edilir. İstənilən təcrübə və ya müşahidədə əldə edilən məlumatların seçmə xətaları səbəbindən yaranma ehtimalı var. Bu xüsusilə sosiologiya üçün doğrudur.

Yəni, təsadüfi baş vermə ehtimalı son dərəcə kiçik olan və ya ifrata meylli olan dəyər statistik əhəmiyyətlidir. Bu kontekstdə ifrat statistik göstəricilərin sıfır fərziyyədən (alınmış nümunə məlumatlarına uyğunluğu yoxlanılan fərziyyə) kənarlaşma dərəcəsidir. Elmi təcrübədə əhəmiyyətlilik səviyyəsi məlumatların toplanmasından əvvəl seçilir və bir qayda olaraq, onun əmsalı 0,05 (5%) təşkil edir. Kritik olduğu sistemlər üçün dəqiq dəyərlər, bu göstərici 0,01 (1%) və ya daha az ola bilər.

Fon

Əhəmiyyət səviyyəsi anlayışı İngilis statistik və genetik Ronald Fisher tərəfindən 1925-ci ildə statistik fərziyyələri yoxlamaq üçün bir texnika hazırlayarkən təqdim edilmişdir. Hər hansı bir prosesi təhlil edərkən müəyyən hadisələrin müəyyən ehtimalı var. "Ölçmə xətası" anlayışına düşən ehtimalların kiçik (və ya aşkar olmayan) faizləri ilə işləyərkən çətinliklər yaranır.

Sınaq üçün kifayət qədər spesifik olmayan statistika ilə işləyərkən, elm adamları kiçik dəyərlərlə işləməyə "qarşısını alan" sıfır fərziyyə problemi ilə qarşılaşdılar. Fisher hesablamalarda sıfır fərziyyəni rədd etməyə imkan verən əlverişli nümunə kəsimi kimi hadisələrin baş vermə ehtimalını 5% (0,05) səviyyəsində müəyyən etməyi belə sistemlər üçün təklif etdi.

Sabit əmsalın tətbiqi

1933-cü ildə Jerzy alimləri Neumann və Egon Pearson öz işlərində əvvəlcədən qurmaq tövsiyə olunur (məlumat toplamadan əvvəl) müəyyən səviyyəəhəmiyyəti. Seçkilər zamanı bu qaydalardan istifadə nümunələri açıq-aydın görünür. Tutaq ki, iki namizəd var, onlardan biri çox populyardır, digəri isə o qədər də tanınmır. Seçkidə birinci namizədin qalib gələcəyi göz qabağındadır, ikincinin şansı isə sıfıra enir. Çalışın - lakin bərabər deyil: hər zaman fors-major, sensasiyalı məlumatlar, gözlənilməz qərarlar ehtimalı var ki, onlar proqnozlaşdırılan seçki nəticələrini dəyişə bilər.

Neumann və Pearson razılaşdılar ki, Fişerin təklif etdiyi 0,05 əhəmiyyət səviyyəsi (α simvolu ilə qeyd olunur) ən əlverişlidir. Ancaq Fişerin özü 1956-cı ildə bu dəyərin müəyyənləşdirilməsinə qarşı çıxdı. O hesab edirdi ki, α səviyyəsi konkret şəraitə uyğun təyin olunmalıdır. Məsələn, hissəciklər fizikasında 0,01-dir.

p-dəyəri

P-dəyəri termini ilk dəfə 1960-cı ildə Brownlee tərəfindən istifadə edilmişdir. P-səviyyəsi (p-dəyəri) içərisində olan bir göstəricidir tərs əlaqə nəticələrin etibarlılığı haqqında. Ən yüksək p-qiyməti dəyişənlər arasında seçmə əlaqəyə inamın ən aşağı səviyyəsinə uyğundur.

Bu dəyər nəticələrin təfsiri ilə bağlı səhvlərin olma ehtimalını əks etdirir. p-dəyəri = 0,05 (1/20) qəbul edin. Nümunədə tapılan dəyişənlər arasındakı əlaqənin seçmənin təsadüfi xüsusiyyəti olması beş faiz şansını göstərir. Yəni bu asılılıq yoxdursa, təkrarlanan oxşar təcrübələrlə orta hesabla hər iyirminci tədqiqatda dəyişənlər arasında eyni və ya daha çox asılılıq gözləmək olar. Çox vaxt p-səviyyəsi səhv səviyyəsinin "marjası" kimi qəbul edilir.

Yeri gəlmişkən, p-dəyəri dəyişənlər arasındakı real əlaqəni əks etdirməyə bilər, ancaq fərziyyələr daxilində müəyyən orta dəyəri göstərir. Xüsusilə, məlumatların yekun təhlili də bu əmsalın seçilmiş dəyərlərindən asılı olacaq. p-səviyyəsi = 0.05 ilə bəzi nəticələr olacaq və əmsalı 0.01-ə bərabər olan digərləri.

Statistik fərziyyələrin yoxlanılması

Fərziyyələrin yoxlanılması zamanı statistik əhəmiyyətin səviyyəsi xüsusilə vacibdir. Məsələn, iki quyruqlu testi hesablayarkən, imtina sahəsi seçmə paylanmasının hər iki ucunda (sıfır koordinata nisbətən) bərabər bölünür və alınan məlumatların həqiqəti hesablanır.

Tutaq ki, müəyyən bir prosesi (hadisəni) izləyərkən məlum oldu ki, yeni statistik məlumat əvvəlki qiymətlərə nisbətən kiçik dəyişiklikləri göstərir. Eyni zamanda, nəticələrdəki uyğunsuzluqlar kiçikdir, aşkar deyil, lakin tədqiqat üçün vacibdir. Mütəxəssis dilemma ilə üzləşir: dəyişikliklər həqiqətən baş verir, yoxsa seçmə səhvləri (ölçmənin qeyri-dəqiqliyi)?

Bu halda sıfır fərziyyə tətbiq edilir və ya rədd edilir (hər şey xəta kimi silinir və ya sistemdəki dəyişiklik yerinə yetirilməmiş kimi tanınır). Məsələnin həlli prosesi ümumi statistik əhəmiyyətin (p-qiyməti) və əhəmiyyətlilik səviyyəsinin (α) nisbətinə əsaslanır. Əgər p-səviyyəsi< α, значит, нулевую гипотезу отвергают. Чем меньше р-value, тем более значимой является тестовая статистика.

İstifadə olunan dəyərlər

Əhəmiyyət səviyyəsi təhlil edilən materialdan asılıdır. Praktikada aşağıdakı sabit dəyərlər istifadə olunur:

  • α = 0,1 (və ya 10%);
  • α = 0,05 (və ya 5%);
  • α = 0,01 (və ya 1%);
  • α = 0,001 (və ya 0,1%).

Hesablamalar nə qədər dəqiq tələb olunursa, α əmsalı bir o qədər kiçik olur. Təbii ki, fizika, kimya, əczaçılıq və genetika üzrə statistik proqnozlar politologiya və sosiologiya ilə müqayisədə daha çox dəqiqlik tələb edir.

Xüsusi sahələrdə əhəmiyyət hədləri

Hissəciklər fizikası və istehsalat kimi yüksək dəqiqliyə malik sahələrdə statistik əhəmiyyət çox vaxt standart kənarlaşmanın (siqma - σ əmsalı ilə qeyd olunur) normal ehtimal paylanmasına (Qauss paylanması) nisbəti kimi ifadə edilir. σ riyazi gözləntilərə nisbətən müəyyən bir kəmiyyətin dəyərlərinin yayılmasını təyin edən statistik göstəricidir. Hadisələrin ehtimalını çəkmək üçün istifadə olunur.

Bilik sahəsindən asılı olaraq σ əmsalı çox dəyişir. Məsələn, Hiqqs bozonunun mövcudluğunu proqnozlaşdırarkən σ parametri beşə bərabərdir (σ=5), bu da p-qiyməti=1/3,5 milyon.sahələrə uyğundur.

Səmərəlilik

Nəzərə almaq lazımdır ki, α və p-qiymət əmsalları dəqiq xarakteristikalar deyil. Tədqiq olunan hadisənin statistikasında əhəmiyyətinin səviyyəsi nə olursa olsun, bu, fərziyyəni qəbul etmək üçün qeyd-şərtsiz əsas deyil. Məsələn, daha az dəyərα, fərziyyənin əsaslandırılma şansı nə qədər böyükdür. Bununla belə, tədqiqatın statistik gücünü (əhəmiyyətini) azaldan səhv riski var.

Yalnız statistikaya diqqət yetirən tədqiqatçılar mənalı nəticələr səhv nəticələr çıxara bilər. Eyni zamanda, onların işini iki dəfə yoxlamaq çətindir, çünki onlar fərziyyələr tətbiq edirlər (bu, əslində α və p-dəyərlərinin dəyərləridir). Buna görə də həmişə statistik əhəmiyyətin hesablanması ilə yanaşı, başqa bir göstəricinin - statistik təsirin miqyasının müəyyən edilməsi tövsiyə olunur. Təsir ölçüsü təsir gücünün kəmiyyət ölçüsüdür.

Statistika çoxdan həyatın ayrılmaz hissəsi olmuşdur. İnsanlar hər yerdə bununla üzləşirlər. Statistikaya əsasən, harada və hansı xəstəliklərin ümumi olduğu, müəyyən bir bölgədə və ya əhalinin müəyyən bir təbəqəsi arasında nəyin daha çox tələb olunduğu barədə nəticələr çıxarılır. Hətta konstruksiyalar da əsaslanır siyasi proqramlar hökumətə namizədlər. Onlar mal alarkən pərakəndə satış şəbəkələri tərəfindən də istifadə olunur və istehsalçılar öz təkliflərində bu məlumatları rəhbər tuturlar.

Statistika cəmiyyətin həyatında mühüm rol oynayır və onun hər bir fərdi üzvünə kiçik formada da olsa təsir göstərir. Məsələn, əgər ilə, insanların çoxu üstünlük verir tünd rənglər müəyyən bir şəhərdə və ya bölgədə paltarda, yerli satış yerlərində çiçəkli çaplı parlaq sarı yağış paltarı tapmaq olduqca çətin olacaq. Bəs bu cür təsirə malik olan bu məlumatları təşkil edən kəmiyyətlər hansılardır? Məsələn, “statistik əhəmiyyətli” nədir? Bu təriflə tam olaraq nə nəzərdə tutulur?

Bu nədir?

Statistika bir elm olaraq müxtəlif kəmiyyətlərin və anlayışların birləşməsindən ibarətdir. Onlardan biri də “statistik əhəmiyyət” anlayışıdır. Bu, dəyişənlərin dəyərinin adıdır, digər göstəricilərin görünmə ehtimalı əhəmiyyətsizdir.

Məsələn, yağışlı bir gecədən sonra payız meşəsində göbələk üçün səhər gəzintisi zamanı hər 10 nəfərdən 9-u ayaqlarına rezin ayaqqabı geyindirir. Onlardan 8-nin kətan mokasinlər taxması ehtimalı cüzidir. Beləliklə, bu xüsusi nümunədə 9 rəqəmi "statistik əhəmiyyət" adlanan dəyərdir.

Buna uyğun olaraq, yuxarıdakıları daha da inkişaf etdirsək praktik nümunə, ayaqqabı mağazaları yay mövsümünün sonuna kimi ilin digər vaxtlarına nisbətən çoxlu miqdarda rezin çəkmələr alır. Deməli, statistik dəyərin böyüklüyü adi həyata öz təsirini göstərir.

Əlbəttə ki, mürəkkəb hesablamalarda, məsələn, virusların yayılmasını proqnozlaşdırarkən, böyük rəqəm dəyişənlər. Ancaq tərifin mahiyyəti əhəmiyyətli göstəricidir statistik məlumatlar - hesablamaların mürəkkəbliyindən və qeyri-sabit qiymətlərin sayından asılı olmayaraq oxşardır.

Necə hesablanır?

Tənliyin "statistik əhəmiyyəti" indikatorunun dəyərinin hesablanması zamanı istifadə olunur. Yəni iddia etmək olar ki, bu halda hər şeyi riyaziyyat həll edir. ən çox sadə variant hesablama aşağıdakı parametrlərin iştirak etdiyi riyazi əməliyyatlar zənciridir:

  • sorğular və ya obyektiv məlumatların öyrənilməsi nəticəsində əldə edilən iki növ nəticə, məsələn, a və b ilə işarələnən alışların həyata keçirildiyi məbləğlər;
  • hər iki qrup üçün göstərici - n;
  • birləşdirilmiş seçmənin payının dəyəri - p;
  • "standart xəta" anlayışı - SE.

Növbəti addım ümumi test göstəricisini müəyyən etməkdir - t, onun dəyəri 1.96 rəqəmi ilə müqayisə edilir. 1.96 Tələbənin t-paylanmasına görə 95% diapazonunu təmsil edən orta dəyərdir.

Tez-tez sual yaranır ki, n və p dəyərləri arasındakı fərq nədir. Bu nüansı bir nümunə ilə aydınlaşdırmaq asandır. Tutaq ki, kişi və qadınların hər hansı bir məhsula və ya brendə sədaqətinin statistik əhəmiyyəti hesablanır.

Bu halda hərflərin ardınca aşağıdakılar gələcək:

  • n - respondentlərin sayı;
  • p - məhsuldan razı qalanların sayı.

Bu halda sorğu edilən qadınların sayı n1 olaraq təyin olunacaq. Müvafiq olaraq, kişilər - n2. Eyni dəyər p simvolunda "1" və "2" rəqəmlərinə sahib olacaq.

Test göstəricisini Tələbənin hesablama cədvəllərinin orta dəyərləri ilə müqayisə etmək "statistik əhəmiyyət" adlanan şeyə çevrilir.

Doğrulama dedikdə nə nəzərdə tutulur?

İstənilən riyazi hesablamanın nəticələri həmişə yoxlanıla bilər, bu, hətta uşaqlara öyrədilir ibtidai məktəb. Güman etmək məntiqlidir ki, statistik göstəricilər hesablamalar zəncirindən istifadə etməklə müəyyən olunduğundan, onlar yoxlanılır.

Bununla belə, statistik əhəmiyyətin yoxlanılması təkcə riyaziyyat deyil. Statistika çoxlu sayda dəyişənlər və müxtəlif ehtimallarla məşğul olur ki, onlar həmişə hesablamaqdan uzaqdırlar. Yəni məqalənin əvvəlində rezin ayaqqabı nümunəsinə qayıtsaq, o zaman mağazalar üçün mal alanların etibar edəcəyi statistik məlumatların məntiqi qurulması payız üçün xarakterik olmayan quru və isti hava ilə pozula bilər. . Bu fenomen nəticəsində rezin çəkmələr alanların sayı azalacaq və satış nöqtələri itkilərə məruz qalacaq. Təbii ki, riyazi düstur hava anomaliyasını qabaqcadan görməyə qadir deyil. Bu an "səhv" adlanır.

Hesablanmış əhəmiyyət səviyyəsinin yoxlanılmasında məhz belə səhvlərin ehtimalı nəzərə alınır. Burada həm hesablanmış göstəricilər, həm də qəbul edilmiş əhəmiyyət səviyyələri, həmçinin şərti olaraq hipotez adlanan kəmiyyətlər nəzərə alınır.

Əhəmiyyət səviyyəsi nədir?

“Səviyyə” anlayışı statistik əhəmiyyətin əsas meyarlarına daxildir. Tətbiqi və praktiki statistikada istifadə olunur. Bu, ehtimalı nəzərə alan bir növ kəmiyyətdir mümkün sapmalar və ya səhvlər.

Səviyyə hazır nümunələrdəki fərqlərin müəyyən edilməsinə əsaslanır, onların əhəmiyyətini və ya əksinə, təsadüfiliyini müəyyən etməyə imkan verir. Bu anlayışın təkcə rəqəmsal mənaları deyil, həm də özünəməxsus şərhləri var. Dəyəri necə başa düşmək lazım olduğunu izah edirlər və nəticənin orta göstərici ilə müqayisəsi ilə səviyyənin özü müəyyən edilir, bu, fərqlərin etibarlılıq dərəcəsini ortaya qoyur.

Beləliklə, səviyyə anlayışını sadə şəkildə təqdim etmək mümkündür - bu, əldə edilən statistik məlumatlardan çıxarılan nəticələrdə məqbul, ehtimal olunan səhv və ya səhvin göstəricisidir.

Hansı əhəmiyyət səviyyələri istifadə olunur?

Təcrübədə səhv ehtimalı əmsallarının statistik əhəmiyyəti üç əsas səviyyəyə əsaslanır.

Birinci səviyyə dəyərin 5% olduğu hədddir. Yəni, xəta ehtimalı 5%-lik əhəmiyyətlilik səviyyəsini keçmir. Bu o deməkdir ki, statistik tədqiqat məlumatları əsasında çıxarılan nəticələrin qüsursuzluğuna və yanılmazlığına inam 95% təşkil edir.

İkinci səviyyə 1%-lik hədddir. Müvafiq olaraq, bu rəqəm 99% əminliklə statistik hesablamalar zamanı əldə edilən məlumatları rəhbər tutmaq deməkdir.

Üçüncü səviyyə 0,1% təşkil edir. Bu dəyərlə səhv ehtimalı faizin bir hissəsinə bərabərdir, yəni səhvlər praktiki olaraq aradan qaldırılır.

Statistikada hipotez nədir?

Bir konsepsiya olaraq səhvlər sıfır fərziyyənin qəbulu və ya rədd edilməsi ilə bağlı iki sahəyə bölünür. Hipoteza, tərifə görə, bir sıra digər məlumat və ya ifadələrin gizləndiyi bir anlayışdır. Yəni statistik uçotun predmetinə aid olan bir şeyin ehtimal paylanmasının təsviri.

Sadə hesablamalarda iki fərziyyə var - sıfır və alternativ. Onların arasında fərq ondadır ki, sıfır fərziyyə statistik əhəmiyyətin müəyyən edilməsində iştirak edən nümunələr arasında fundamental fərqlərin olmaması ideyasına əsaslanır və alternativ hipotez onun tamamilə əksinədir. Yəni, alternativ fərziyyə bu nümunələrdə əhəmiyyətli fərqin olmasına əsaslanır.

Səhvlər hansılardır?

Statistikada bir konsepsiya kimi səhvlər bu və ya digər fərziyyənin doğru kimi qəbul edilməsindən birbaşa asılıdır. Onları iki istiqamətə və ya növə bölmək olar:

  • birinci növ, yanlış olduğu ortaya çıxan sıfır fərziyyənin qəbul edilməsi ilə bağlıdır;
  • ikincisi isə alternativə əməl etməklə yaranır.

Birinci növ səhv yanlış müsbət adlanır və statistikanın istifadə olunduğu bütün sahələrdə kifayət qədər yaygındır. Müvafiq olaraq, ikinci növ səhv yanlış mənfi adlanır.

Statistikada reqressiya niyə vacibdir?

Reqressiyanın statistik əhəmiyyəti ondan ibarətdir ki, ondan verilənlər əsasında hesablanmış müxtəlif asılılıqlar modelinin reallığa nə qədər uyğun olduğunu müəyyən etmək olar; mühasibat uçotu və nəticələr üçün kifayət və ya çatışmayan amilləri müəyyən etməyə imkan verir.

Reqressiya dəyəri nəticələri Fisher cədvəllərində sadalanan məlumatlar ilə müqayisə etməklə müəyyən edilir. Və ya variasiya təhlilindən istifadə etməklə. Əhəmiyyət reqressiya göstəriciləri kompleksə malikdir statistik tədqiqatlar və əhatə edən hesablamalar çoxlu sayda dəyişənlər, təsadüfi məlumatlar və ehtimal olunan dəyişikliklər.

Oxşar məqalələr