Ümumi əhali və nümunə tədqiqatı. Statistik etibarlılıq

Statistik əhəmiyyəti

Müəyyən bir tədqiqat prosedurundan istifadə edərək əldə edilən nəticələr deyilir statistik əhəmiyyətlidir onların təsadüfi baş vermə ehtimalı çox kiçik olarsa. Bu anlayışı sikkə atmaq nümunəsi ilə göstərmək olar. Tutaq ki, bir sikkə 30 dəfə çevrildi; O, 17 dəfə baş və 13 dəfə quyruq qalxdı. Edir mənalı Bu gözlənilən nəticədən (15 baş və 15 quyruq) sapmadır, yoxsa bu təsadüfdür? Bu suala cavab vermək üçün, məsələn, eyni sikkəni ardıcıl olaraq 30 dəfə atmaq və eyni zamanda 17:13-ə bərabər olan baş və quyruq nisbətinin neçə dəfə təkrarlandığını qeyd edə bilərsiniz. Statistik təhlil bizi bu yorucu prosesdən xilas edir. Onun köməyi ilə ilk 30 sikkə atışından sonra 17 baş və 13 quyruğun təsadüfi hadisələrinin mümkün sayını təxmin etmək mümkündür. Belə bir qiymətləndirmə ehtimal ifadəsi adlanır.

Sənaye-təşkilati psixologiya üzrə elmi ədəbiyyatda riyazi formada ehtimal ifadəsi ifadəsi ilə işarələnir. R(ehtimal)< (менее) 0,05 (5 %), которое следует читать как «вероятность менее 5 %». В примере с киданием монеты это утверждение будет означать, что если исследователь проведет 100 опытов, каждый раз кидая монету по 30 раз, то он может ожидать случайного выпадения комбинации из 17 «орлов» и 13 «решек» менее, чем в 5 опытах. Этот результат будет сочтен статистически значимым, поскольку в индустриально-организационной психологии уже давно приняты стандарты statistik əhəmiyyəti 0,05 və 0,01 (R< 0,01). Bu fakt ədəbiyyatı başa düşmək üçün vacibdir, lakin bu standartlara uyğun gəlməyən müşahidələr aparmağın mənasız olduğu mənasına gəlməməlidir. Əhəmiyyətli olmayan tədqiqat nəticələri (təsadüfən əldə edilə bilən müşahidələr). daha çox 100-dən bir və ya beş dəfə) tendensiyaları müəyyən etmək və gələcək tədqiqatlar üçün bələdçi kimi çox faydalı ola bilər.

Onu da qeyd etmək lazımdır ki, bütün psixoloqlar ənənəvi standartlar və prosedurlarla razılaşmırlar (məsələn, Cohen, 1994; Sauley & Bedeian, 1989). Ölçmələrlə bağlı məsələlər özlərinə aiddir Əsas mövzuölçmə üsullarının düzgünlüyünü və əsasında duran ilkin şərtləri öyrənən bir çox tədqiqatçının işi mövcud üsullar və standartlar, eləcə də yeni həkimlərin və alətlərin hazırlanması. Ola bilsin ki, gələcəkdə nə vaxtsa bu gücdə aparılan tədqiqatlar statistik əhəmiyyəti qiymətləndirmək üçün ənənəvi standartların dəyişməsinə gətirib çıxaracaq və bu dəyişikliklər hamılıqla qəbul ediləcək. (Amerika Psixoloji Assosiasiyasının Beşinci Fəsli təxminlərin, ölçmələrin və statistikanın öyrənilməsində ixtisaslaşmış psixoloqları bir araya gətirir.)

Araşdırma hesabatlarında, kimi bir ehtimal ifadəsi R< 0,05, bəzilərinə görə statistika yəni müəyyən bir sıra riyazi hesablama prosedurları nəticəsində əldə edilən ədəd. Ehtimal təsdiqi bu statistik məlumatları bu məqsədlə dərc edilən xüsusi cədvəllərdən alınan məlumatlar ilə müqayisə etməklə əldə edilir. Sənaye-təşkilati psixoloji tədqiqatlarda statistika kimi r, F, t, r>("chi kvadrat" oxuyun) və R("çoxlu" oxuyun R"). Hər bir halda, bir sıra müşahidələrin təhlilindən əldə edilən statistika (bir ədəd) dərc olunmuş cədvəldəki rəqəmlərlə müqayisə oluna bilər. Bundan sonra bu ədədin təsadüfi əldə edilməsi ehtimalı haqqında ehtimal ifadəsini formalaşdırmaq, yəni müşahidələrin əhəmiyyəti haqqında nəticə çıxarmaq olar.

Bu kitabda təsvir edilən araşdırmaları başa düşmək üçün statistik əhəmiyyət anlayışını aydın şəkildə başa düşmək kifayətdir və yuxarıda qeyd olunan statistikanın necə hesablandığını mütləq bilməmək kifayətdir. Bununla belə, bütün bu prosedurların əsasında duran bir fərziyyəni müzakirə etmək faydalı olardı. Bu, bütün müşahidə olunan dəyişənlərin normal qanuna uyğun olaraq təxminən paylandığı fərziyyəsidir. Bundan əlavə, sənaye-təşkilati psixoloji tədqiqatlar haqqında hesabatları oxuyarkən çox vaxt mühüm rol oynayan daha üç anlayış var - birincisi, korrelyasiya və korrelyasiya, ikincisi, determinant / proqnozlaşdırıcı dəyişən və "ANOVA" (diferensiyanın təhlili), üçüncüsü. , altında statistik üsullar qrupu ümumi ad"meta-analiz".

Tapşırıq 3. Beş məktəbəqədər uşağa test təqdim olunur. Hər tapşırığın həlli üçün vaxt müəyyən edilir. Testin ilk üç tapşırığını həll etmək vaxtı arasında statistik əhəmiyyətli fərqlər olacaqmı?

subyektlərin sayı

İstinad materialı

Bu tapşırıq dispersiya təhlili nəzəriyyəsinə əsaslanır. Ümumi halda dispersiya təhlilinin vəzifəsi eksperimentin nəticəsinə əhəmiyyətli təsir göstərən amilləri müəyyən etməkdir. Nümunələrin sayı ikidən çox olarsa, dispersiya təhlili bir neçə nümunənin ortalarını müqayisə etmək üçün istifadə edilə bilər. Bu məqsədlə birtərəfli dispersiya təhlili xidmət edir.

Qarşıya qoyulan vəzifələri həll etmək üçün aşağıdakılar qəbul edilir. Əgər amillərin təsiri zamanı optimallaşdırma parametrinin əldə edilmiş qiymətlərinin dəyişmələri amillərin təsiri olmadıqda nəticələrin dispersiyalarından fərqlənirsə, belə bir amil əhəmiyyətli hesab olunur.

Məsələnin tərtibindən göründüyü kimi, burada statistik fərziyyələrin yoxlanılması üsullarından, yəni iki empirik variasiyanın yoxlanılması problemindən istifadə olunur. Buna görə də dispersiya təhlili dispersiyaların Fişer kriteriyası ilə yoxlanılmasına əsaslanır. Bu tapşırıqda altı məktəbəqədər uşağın hər biri tərəfindən testin ilk üç tapşırığını həll etmə vaxtı arasındakı fərqlərin statistik əhəmiyyətli olub olmadığını yoxlamaq lazımdır.

Sıfır (əsas) fərziyyə H o adlanır. e-nin mahiyyəti müqayisə edilən parametrlər arasındakı fərqin sıfır olması (bu səbəbdən fərziyyənin adı - sıfır) və müşahidə edilən fərqlərin təsadüfi olması fərziyyəsinə endirilir.

Rəqabətli (alternativ) fərziyyə H 1 adlanır və sıfıra ziddir.

Həll:

α = 0,05 əhəmiyyət səviyyəsində dispersiya təhlili metodundan istifadə edərək, altı məktəbəqədər uşaqda testin ilk üç tapşırığını həll etmə vaxtı arasında statistik əhəmiyyətli fərqlərin mövcudluğu haqqında sıfır fərziyyəni (Hо) yoxlayacağıq.

Üç test tapşırığının hər birini həll etmək üçün orta vaxt tapdığımız tapşırıq şərtləri cədvəlini nəzərdən keçirin

subyektlərin sayı

Faktor səviyyələri

Testin ilk tapşırığını həll etmək vaxtıdır (san.).

Testin ikinci tapşırığını həll etmək vaxtıdır (san.).

Testin üçüncü tapşırığını həll etmək vaxtıdır (san.).

Qrup orta

Ümumi ortanın tapılması:

Hər bir testin vaxt fərqlərinin əhəmiyyətini nəzərə almaq üçün ümumi seçmə dispersiya iki hissəyə bölünür, birincisi faktorial, ikincisi isə qalıq adlanır.

Düsturdan istifadə edərək variantın ümumi ortadan kvadrat kənara çıxmalarının ümumi cəmini hesablayın

və ya , burada p - test tapşırıqlarının həlli üçün vaxt ölçmələrinin sayı, q - mövzuların sayı. Bunu etmək üçün, kvadratlar seçimini bir cədvəl hazırlayacağıq

subyektlərin sayı

Faktor səviyyələri

Testin ilk tapşırığını həll etmək vaxtıdır (san.).

Testin ikinci tapşırığını həll etmək vaxtıdır (san.).

Testin üçüncü tapşırığını həll etmək vaxtıdır (san.).

Tədqiqat adətən faktlarla yoxlanılmalı olan bəzi fərziyyələrlə başlayır. Bu fərziyyə – fərziyyə – müəyyən obyektlər toplusunda hadisələrin və ya xassələrin əlaqəsi ilə bağlı formalaşır.

Bu cür fərziyyələri faktlar üzərində yoxlamaq üçün onların daşıyıcılarının müvafiq xassələrini ölçmək lazımdır. Ancaq bütün yeniyetmələrdə aqressivliyi ölçmək mümkün olmadığı kimi, bütün qadınlarda və kişilərdə narahatlığı ölçmək mümkün deyil. Buna görə də, bir araşdırma apararkən, onlar insanların müvafiq populyasiyalarının nümayəndələrinin yalnız nisbətən kiçik bir qrupu ilə məhdudlaşırlar.

Əhali- bu, tədqiqat fərziyyəsinin formalaşdırıldığı obyektlərin bütün toplusudur.

Məsələn, bütün kişilər; və ya bütün qadınlar; ya da bir şəhərin bütün sakinləri. Tədqiqatçının tədqiqatın nəticələrinə əsasən nəticə çıxaracağı ümumi əhali, məsələn, müəyyən bir məktəbin bütün birinci sinif şagirdləri sayca daha kiçik və daha təvazökar ola bilər.

Beləliklə, ümumi əhali sayca sonsuz olmasa da, bir qayda olaraq, davamlı tədqiqat üçün əlçatmaz olan çoxsaylı potensial subyektlərdir.

Nümunə və ya nümunə populyasiyası- bu, xassələrini öyrənmək üçün ümumi əhali arasından xüsusi olaraq seçilmiş, məhdud sayda obyektlər qrupudur (psixologiyada - subyektlər, respondentlər). Buna uyğun olaraq, bir nümunə üzərində ümumi əhalinin xüsusiyyətlərinin öyrənilməsi deyilir seçmə tədqiqat. Demək olar ki, hamısı psixoloji tədqiqat seçici xarakter daşıyır və onların nəticələri ümumi populyasiyalara aiddir.

Beləliklə, fərziyyə formalaşdırıldıqdan və müvafiq ümumi populyasiyalar müəyyən edildikdən sonra tədqiqatçı nümunənin təşkili problemi ilə üzləşir. Nümunə elə olmalıdır ki, seçmə tədqiqatının nəticələrinin ümumiləşdirilməsi əsaslandırılsın - ümumiləşdirmə, onların ümumi əhaliyə paylanması. Tədqiqatın nəticələrinin etibarlılığının əsas meyarlarıbunlar seçmənin reprezentativliyi və (empirik) nəticələrin statistik etibarlılığıdır.

Nümunə təmsilçiliyi- başqa sözlə desək, onun reprezentativliyi nümunənin tədqiq olunan hadisələri kifayət qədər tam şəkildə - onların ümumi populyasiyada dəyişkənliyi nöqteyi-nəzərindən təqdim etmək qabiliyyətidir.

Əlbəttə ki, yalnız ümumi əhali tədqiq olunan hadisənin bütün diapazonunda və dəyişkənlik nüanslarında tam təsəvvür yarada bilər. Buna görə də reprezentativlik həmişə seçmənin məhdud olduğu dərəcədə məhduddur. Və tədqiqatın nəticələrinin ümumiləşdirilməsinin sərhədlərinin müəyyən edilməsində əsas meyar seçmənin reprezentativliyidir. Buna baxmayaraq, tədqiqatçı üçün kifayət qədər təmsilçi nümunə əldə etməyə imkan verən üsullar mövcuddur (Bu üsullar "Eksperimental Psixologiya" kursunda öyrənilir).


Birinci və əsas texnika sadə təsadüfi (təsadüfi) seçimdir. Bu, əhalinin hər bir üzvünün nümunəyə daxil olmaq şansının bərabər olmasını təmin etməyi nəzərdə tutur. Təsadüfi seçim ümumi əhalinin ən müxtəlif nümayəndələrinin nümunəsinə daxil olmaq imkanı verir. Eyni zamanda, seçimdə hər hansı bir qanunauyğunluğun görünüşünü istisna etmək üçün xüsusi tədbirlər görülür. Və bu, ümid etməyə imkan verir ki, nəticədə nümunədə tədqiq olunan əmlak, ümumiyyətlə olmasa da, maksimum mümkün müxtəliflikdə təmsil olunacaq.

Reprezentativliyi təmin etməyin ikinci yolu təbəqəli təsadüfi seçim və ya ümumi əhalinin xüsusiyyətlərinə görə seçimdir. O, tədqiq olunan əmlakın dəyişkənliyinə təsir göstərə bilən keyfiyyətlərin ilkin müəyyən edilməsini nəzərdə tutur (bu, cins, gəlir səviyyəsi və ya təhsil və s. ola bilər). Sonra bu keyfiyyətlərə görə fərqlənən qrupların (təbəqələrin) sayının ümumi populyasiyada faiz nisbəti müəyyən edilir və seçmədə müvafiq qrupların eyni faiz nisbəti təmin edilir. Bundan əlavə, nümunənin hər bir alt qrupunda subyektlər sadə təsadüfi seçim prinsipinə uyğun olaraq seçilir.

Statistik etibarlılıq, və ya statistik əhəmiyyəti olduqda, tədqiqatın nəticələri statistik nəticə çıxarma üsullarından istifadə etməklə müəyyən edilir.

Araşdırmanın nəticələrindən müəyyən nəticələr çıxarmaqla, qərar qəbul edərkən səhvlərdən sığortalanırıqmı? Əlbəttə yox. Axı bizim qərarlarımız həm seçmə populyasiyanın tədqiqatının nəticələrinə, həm də psixoloji biliklərimizin səviyyəsinə əsaslanır. Biz səhvlərdən tam immun deyilik. Statistikada bu cür səhvlər 1000-dən çox olmayan halda baş verərsə məqbul hesab edilir (səhv ehtimalı α = 0,001 və ya düzgün nəticənin etibarlılıq ehtimalının əlaqəli dəyəri p = 0,999); 100-dən bir halda (səhv ehtimalı α = 0.01 və ya düzgün nəticənin etibarlılıq ehtimalının əlaqəli dəyəri p = 0.99) və ya 100-dən beş halda (səhv ehtimalı α = 0.05 və ya etibarlılıq ehtimalının əlaqəli dəyəri p = 0.99) düzgün çıxış p=0,95). Psixologiyada qərar qəbul etmək adət olaraq son iki səviyyədədir.

Bəzən statistik əhəmiyyətdən danışarkən "əhəmiyyət səviyyəsi" (α kimi qeyd olunur) anlayışından istifadə olunur. P və α-nın ədədi dəyərləri bir-birini 1000-ə qədər tamamlayır - hadisələrin tam dəsti: ya düzgün nəticə çıxardıq, ya da səhv etdik. Bu səviyyələr hesablanmır, müəyyən edilir. Əhəmiyyət səviyyəsini bir növ "qırmızı" xətt kimi başa düşmək olar, onun kəsişməsi bizə bu hadisədən təsadüfi olmayan kimi danışmağa imkan verəcəkdir. Hər bir səlahiyyətli elmi hesabatda və ya nəşrdə çıxarılan nəticələr, nəticələrin verildiyi p və ya α qiymətlərinin göstəricisi ilə müşayiət olunmalıdır.

Statistik nəticə çıxarma üsulları “Riyazi statistika” kursunda ətraflı müzakirə olunur. Hələlik yalnız qeyd edirik ki, nömrəyə müəyyən tələblər qoyurlar, ya da nümunə ölçüsü.

Təəssüf ki, tələb olunan nümunə ölçüsünün ilkin müəyyən edilməsi ilə bağlı ciddi tövsiyələr yoxdur. Üstəlik, tədqiqatçı adətən onun lazımi və kifayət qədər sayı ilə bağlı suala cavabı çox gec alır - yalnız artıq sorğulanmış nümunənin məlumatlarını təhlil etdikdən sonra. Bununla belə, ən ümumi tövsiyələr tərtib edilə bilər:

1. Diaqnostika texnikasını inkişaf etdirərkən ən böyük nümunə ölçüsü lazımdır - 200-dən 1000-2500 nəfərə qədər.

2. 2 nümunəni müqayisə etmək lazımdırsa, onların ümumi sayı ən azı 50 nəfər olmalıdır; müqayisə edilən nümunələrin sayı təxminən eyni olmalıdır.

3. Əgər hər hansı xassələr arasında əlaqə öyrənilirsə, onda seçmənin həcmi ən azı 30-35 nəfər olmalıdır.

4. Daha çox dəyişkənlik tədqiq olunan əmlakın nümunə ölçüsü nə qədər böyükdürsə. Buna görə də dəyişkənliyi nümunənin homojenliyini artırmaqla, məsələn, cinsə, yaşa görə və s. azaltmaq olar. Bu, təbii ki, nəticələrin ümumiləşdirilməsi imkanını azaldır.

Asılı və müstəqil nümunələr. Tipik tədqiqat vəziyyəti tədqiqatçı üçün maraq doğuran xüsusiyyətin sonrakı müqayisə üçün iki və ya daha çox nümunə üzərində öyrənilməsidir. Bu nümunələr onların təşkili prosedurundan asılı olaraq müxtəlif nisbətlərdə ola bilər. Müstəqil nümunələr bir seçmənin hər hansı subyektinin seçilmə ehtimalının digər seçmə subyektlərinin hər hansı birinin seçilməsindən asılı olmaması ilə xarakterizə olunur. qarşı, asılı nümunələr bir nümunənin hər bir subyektinin başqa bir nümunənin subyekti ilə müəyyən bir meyarla uyğunlaşdırılması ilə xarakterizə olunur.

Ümumi halda, asılı nümunələr müqayisə edilən nümunələrdə subyektlərin ikili seçimini, müstəqil nümunələr isə subyektlərin müstəqil seçimini nəzərdə tutur.

Qeyd etmək lazımdır ki, "qismən asılı" (və ya "qismən müstəqil") nümunələrin hallarına icazə verilmir: bu, onların təmsilçiliyini gözlənilməz şəkildə pozur.

Sonda qeyd edirik ki, psixoloji tədqiqatın iki paradiqmasını ayırd etmək olar.

Sözdə R-metodologiyası hansısa təsirin, faktorun və ya digər xassələrin təsiri altında müəyyən xassə (psixoloji) dəyişkənliyinin öyrənilməsini nəzərdə tutur. Nümunə mövzular toplusudur.

Başqa bir yanaşma Q-metodologiyası, müxtəlif stimulların (şərait, situasiya və s.) təsiri altında subyektin (tək) dəyişkənliyinin öyrənilməsini nəzərdə tutur. Bu vəziyyətə uyğundur nümunə stimullar toplusudur.

Statistik tədqiqatın vəzifəsi tədqiq olunan hadisələrin təbiətində olan qanunauyğunluqları müəyyən etməkdir. Göstəricilər və orta dəyərlər reallığın əksi kimi xidmət etməlidir, bunun üçün onların etibarlılıq dərəcəsini müəyyən etmək lazımdır. Ümumi əhalinin seçmə əhalisinin düzgün göstərilməsi reprezentativlik adlanır . Nümunə statistik dəyərlərin düzgünlüyünün və etibarlılığının ölçüsü nümunənin ölçüsündən və tədqiq olunan əlamət üçün seçmə populyasiyasının müxtəliflik dərəcəsindən asılı olan orta təmsilçilik (nümayəndəlik) səhvləridir.

Buna görə də, statistik tədqiqatın nəticələrinin etibarlılıq dərəcəsini müəyyən etmək üçün hər bir nisbi və orta qiymət üçün müvafiq orta xətanı hesablamaq lazımdır. m p göstəricisinin orta xətası düsturla hesablanır:

Müşahidələrin sayı 30-dan az olduqda, harada

P - göstəricinin faizlə dəyəri, ppm və s.

q - bu göstəricinin faizlə olduqda 100-ə, % 0 olarsa 1000-ə əlavə edilməsi və s. (yəni q = 100–P, 1000–P və s.)

Məsələn, rayonda il ərzində 224 nəfərin dizenteriya xəstəliyinə tutulduğu məlumdur. Əhalisi 33.000. Dizenteriya ilə xəstələnmə nisbəti

Bu göstəricinin orta xətası

Göstəricinin etibarlılıq dərəcəsi məsələsini həll etmək üçün göstəricinin orta səhvinə nisbətinə bərabər olan bir inam əmsalı (t) müəyyən edilir, yəni.

Bizim nümunəmizdə

t nə qədər yüksəkdirsə, inam dərəcəsi bir o qədər yüksəkdir. t=1-də göstəricinin etibarlılıq ehtimalı 68,3%, t=2-də - 95,5%, t=3-də - 99,7% təşkil edir. Tibbi statistik tədqiqatlarda adətən 95,5%-99,0%, ən məsuliyyətli hallarda isə 99,7% etibarlılıq səviyyəsi (etibarlılıq) istifadə olunur. Beləliklə, bizim nümunəmizdə insident nisbəti etibarlıdır.

Əgər müşahidələrin sayı 30-dan azdırsa, meyarın qiyməti Tələbə cədvəli ilə müəyyən edilir. Əldə edilən dəyər cədvəlin dəyərindən yüksək və ya bərabərdirsə, göstərici etibarlıdır. Daha aşağıdırsa, etibarlı deyil.

İki homojen göstəricini müqayisə etmək lazımdırsa, onların fərqlərinin etibarlılığı düsturla müəyyən edilir:

(böyük rəqəmdən kiçik olanı çıxarın)

burada P 1 –P 2 müqayisə edilən iki göstərici arasındakı fərqdir,

iki göstərici arasındakı fərqin orta xətasıdır.

Məsələn, B rayonunda il ərzində 270 nəfər dizenteriya ilə xəstələnib. Rayonun əhalisi 45000 nəfərdir.Buna görə də dizenteriya xəstəliyi:

olanlar. insident nisbəti düzgündür.

Gördüyünüz kimi, B regionunda insidentlik A regionundan aşağıdır. İki göstərici arasındakı fərqin etibarlılığını düsturdan istifadə edərək müəyyən edirik:

Müşahidələrin sayı çox olarsa (30-dan çox), t = 2 və ya daha çox olduqda göstəricilərdəki fərq statistik əhəmiyyətlidir. Beləliklə, bizim nümunəmizdə A bölgəsində insident əhəmiyyətli dərəcədə yüksəkdir, çünki güvən əmsalı (t) 2-dən böyükdür.

Göstəricinin orta xətasının qiymətini bilməklə, təsadüfi səbəblərin təsirindən asılı olaraq bu göstəricinin etibar həddini müəyyən etmək mümkündür. Etibar sərhədləri düsturla müəyyən edilir:

P göstəricidir;

m onun orta xətasıdır;

t etibarlılıq əmsalı tələb olunan etibarlılıq qiymətindən asılı olaraq seçilir: t=1 68,3% hallarda nəticənin etibarlılığına uyğundur, t=2 - 95,5%, t=2,6 - 99%, t=3 - 99,7 % , t=3,3 - 99,9 Qiymət marjinal xəta adlanır.

Məsələn, B bölgəsində 99,7-9% dəqiqliklə dizenteriya ilə xəstələnmə nisbəti təsadüfi amillərə görə dəyişə bilər. 49,1-dən 70,9-a qədər.

Dəyişənlər arasında istənilən əlaqənin əsas xüsusiyyətləri.

Ən çox ikisi sadə xassələri dəyişənlər arasında əlaqələr: (a) əlaqənin miqyası və (b) əlaqənin etibarlılığı.

- Dəyər . Asılılığın ölçüsünü başa düşmək və ölçmək etibarlılıqdan daha asandır. Məsələn, nümunədəki hər hansı bir kişidə hər hansı bir qadından daha yüksək ağ qan hüceyrələrinin sayı (WCC) varsa, o zaman iki dəyişən (Gender və WCC) arasındakı əlaqənin çox yüksək olduğunu söyləyə bilərsiniz. Başqa sözlə, bir dəyişənin dəyərlərini digərinin dəyərlərindən təxmin edə bilərsiniz.

- Etibarlılıq ("həqiqət"). Qarşılıqlı asılılığın etibarlılığı asılılığın miqyasından daha az əyani anlayışdır, lakin son dərəcə vacibdir. Asılılığın etibarlılığı müəyyən bir nümunənin təmsilçiliyi ilə birbaşa bağlıdır, bunun əsasında nəticələr çıxarılır. Başqa sözlə, etibarlılıq əlaqənin eyni populyasiyadan götürülmüş başqa bir nümunədən alınan məlumatlar əsasında yenidən aşkar edilməsi (başqa sözlə, təsdiqlənməsi) ehtimalının nə qədər yüksək olduğuna aiddir.

Yadda saxlamaq lazımdır ki, son məqsəd demək olar ki, heç vaxt bu xüsusi dəyərlər nümunəsinin öyrənilməsi deyil; nümunə yalnız bütün əhali haqqında məlumat verdiyi üçün maraq doğurur. Tədqiqat bəzi xüsusi meyarlara cavab verirsə, o zaman seçmə dəyişənləri arasında aşkar edilmiş əlaqələrin etibarlılığı standart statistik ölçüdən istifadə etməklə kəmiyyətlə ölçülə və təqdim edilə bilər.

Asılılığın böyüklüyü və etibarlılığı ikidir müxtəlif xüsusiyyətlər dəyişənlər arasında asılılıqlar. Lakin onların tam müstəqil olduqlarını söyləmək olmaz. Normal ölçülü nümunədə dəyişənlər arasında əlaqə (əlaqə) nə qədər böyükdürsə, o, bir o qədər etibarlıdır (növbəti bölməyə baxın).

Nəticənin statistik əhəmiyyəti (p-səviyyəsi) onun "həqiqi"liyinə ("nümunənin təmsilçiliyi" mənasında) inamın təxmin edilən ölçüsüdür. Daha texniki baxımdan, p-dəyəri nəticənin etibarlılığından asılılığı azalan bir ölçüdür. Daha çox yüksək p səviyyəsi daha çox uyğun gəlir aşağı səviyyə nümunədə tapılan dəyişənlər arasındakı asılılığa inam. Məhz, p-səviyyəsi müşahidə olunan nəticənin bütün əhaliyə paylanması ilə bağlı səhv ehtimalını təmsil edir.

Misal üçün, p-səviyyəsi = 0,05(yəni 1/20) nümunədə tapılan dəyişənlər arasındakı əlaqənin bu seçmənin təsadüfi xüsusiyyəti olması ehtimalının 5% olduğunu göstərir. Bir çox tədqiqatda p-səviyyəsi 0,05 səhv səviyyəsi üçün "məqbul həddi" kimi qəbul edilir.

Əhəmiyyətin hansı səviyyəsinin həqiqətən "əhəmiyyətli" hesab edilməsinə qərar verməkdə özbaşınalıqdan qaçmaq üçün heç bir yol yoxdur. Seçim müəyyən səviyyə yuxarıda nəticələrin yalan kimi rədd edilməsinin əhəmiyyəti olduqca ixtiyaridir.



Təcrübədə son qərar bir qayda olaraq, nəticənin apriori (yəni eksperiment aparılmazdan əvvəl) proqnozlaşdırılmamasından və ya çoxlu təhlil və müqayisələr nəticəsində bir posteriori aşkar edilməsindən, eləcə də bu sahədə mövcud olan ənənədən asılıdır. tədqiqatın.

Tipik olaraq, bir çox domenlərdə p .05 nəticəsi məqbul statistik əhəmiyyət kəsb edir, lakin yadda saxlamaq lazımdır ki, bu səviyyə hələ də kifayət qədər az sayda göstəriciləri əhatə edir. böyük ehtimalla səhvlər (5%).

p .01-də əhəmiyyətli nəticələr adətən statistik cəhətdən əhəmiyyətli hesab edilir, p .005 və ya p-də nəticələr. 001 çox əhəmiyyətlidir. Bununla belə, başa düşmək lazımdır ki, əhəmiyyət səviyyələrinin bu təsnifatı olduqca ixtiyaridir və sadəcə praktik təcrübəyə əsaslanan qeyri-rəsmi bir konvensiyadır. müəyyən bir təhsil sahəsində.

Aydındır ki, nə daha çox təhlillər toplanmış məlumatların cəmi ilə aparılacaq, əhəmiyyətli (seçilmiş səviyyədə) nəticələrin sayı nə qədər çox olarsa, sırf təsadüf nəticəsində tapılacaqdır.

Çoxsaylı müqayisələri ehtiva edən və beləliklə, bu cür səhvləri təkrarlamaq şansına malik olan bəzi statistik metodlar üçün xüsusi düzəliş və ya düzəliş edilir. ümumi sayı müqayisələr. Bununla belə, bir çox statistik üsullar (xüsusilə sadə üsullar kəşfiyyat məlumatlarının təhlili) bu problemi həll etmək üçün heç bir yol təklif etmir.

Dəyişənlər arasında əlaqə "obyektiv" zəifdirsə, böyük bir nümunəni araşdırmaqdan başqa belə bir əlaqəni yoxlamaq üçün başqa yol yoxdur. Nümunə mükəmməl şəkildə təmsil olunsa belə, nümunə kiçik olarsa, təsir statistik əhəmiyyət kəsb etməyəcəkdir. Eyni şəkildə, əgər bir asılılıq "obyektiv olaraq" çox güclüdürsə, o zaman onu aşkar etmək olar yüksək dərəcəçox kiçik bir nümunədə belə əhəmiyyətlidir.

Dəyişənlər arasındakı əlaqə nə qədər zəif olarsa, onu əhəmiyyətli dərəcədə aşkar etmək üçün tələb olunan nümunə daha böyükdür.

Çox fərqli əlaqələr dəyişənlər arasında. Müəyyən bir tədqiqatda müəyyən ölçünün seçilməsi dəyişənlərin sayından, istifadə olunan ölçmə şkalalarından, asılılıqların xarakterindən və s.

Lakin bu tədbirlərin əksəriyyətinə tabedir ümumi prinsip: müşahidə olunan əlaqəni sözügedən dəyişənlər arasında "ağıla gələn maksimum əlaqə" ilə müqayisə edərək qiymətləndirməyə çalışırlar. Texniki cəhətdən belə hesablamalar aparmağın adi yolu dəyişənlərin dəyərlərinin necə dəyişdiyinə baxmaq və sonra mövcud olan ümumi variasiyanın nə qədərinin “ümumi” (“birgə”) variasiyanın olması ilə izah oluna biləcəyini hesablamaqdır. iki (və ya daha çox) dəyişənlərdə.

Əhəmiyyətlilik əsasən nümunənin ölçüsündən asılıdır. Artıq izah edildiyi kimi, çox böyük nümunələrdə dəyişənlər arasında çox zəif əlaqələr belə əhəmiyyətli olacaq, kiçik nümunələrdə isə çox güclü əlaqələr belə etibarlı deyil.

Beləliklə, statistik əhəmiyyət səviyyəsini müəyyən etmək üçün hər bir seçmə ölçüsü üçün dəyişənlər arasındakı əlaqənin "böyükliyi" və "əhəmiyyəti" arasındakı əlaqəni təmsil edəcək bir funksiya lazımdır.

Belə bir funksiya “populyasiyada belə bir asılılığın olmadığını fərz etsək, müəyyən ölçülü nümunədə verilmiş dəyərdən (və ya daha çox) asılılığın əldə edilməsi ehtimalının nə dərəcədə olduğunu” dəqiq göstərəcək. Başqa sözlə, bu funksiya əhəmiyyət səviyyəsini verəcəkdir
(p-səviyyəsi) və buna görə də populyasiyada verilmiş əlaqənin olmadığı fərziyyəsini səhvən rədd etmək ehtimalı.

Bu "alternativ" fərziyyə (populyasiyada asılılığın olmaması) adətən adlanır sıfır hipotez.

Səhv ehtimalını hesablayan funksiya xətti olsaydı və yalnız müxtəlif nümunə ölçüləri üçün fərqli yamaclara malik olsaydı, ideal olardı. Təəssüf ki, bu funksiya çox daha mürəkkəbdir və həmişə eyni deyil. Bununla belə, əksər hallarda onun forması məlumdur və müəyyən ölçülü nümunələri araşdırarkən əhəmiyyət səviyyələrini müəyyən etmək üçün istifadə edilə bilər. Bu funksiyaların əksəriyyəti adlanan paylamalar sinfi ilə bağlıdır normal .

Oxşar məqalələr