Statistinio reikšmingumo lygis. Pagrindiniai medicinos statistikos terminai ir sąvokos

Statistinis pagrįstumas yra labai svarbus FCC skaičiavimo praktikoje. Anksčiau buvo pažymėta, kad iš tos pačios populiacijos galima pasirinkti daug pavyzdžių:

Jei jie parinkti teisingai, tai jų vidutiniai rodikliai ir bendrosios visumos rodikliai vienas nuo kito šiek tiek skiriasi reprezentatyvumo paklaidos dydžiu, atsižvelgiant į priimtą patikimumą;

Jei jie pasirenkami iš skirtingų bendrųjų populiacijų, skirtumas tarp jų yra reikšmingas. Imčių palyginimas paprastai yra svarstomas statistikoje;

Jeigu jie skiriasi nežymiai, nesvarbiai, nežymiai, tai yra iš tikrųjų priklauso tai pačiai bendrajai populiacijai, skirtumas tarp jų vadinamas statistiškai nepatikimu.

statistiškai reikšmingas imties skirtumas – tai labai ir iš esmės besiskirianti imtis, t.y., priklauso skirtingoms bendroms populiacijoms.

FCC rezultatas statistinis pagrįstumas imčių skirtumai reiškia daugelio praktinių problemų sprendimą. Pavyzdžiui, naujų mokymo metodų, programų, pratimų rinkinių, testų, kontrolinių pratimų diegimas siejamas su jų eksperimentiniu patikrinimu, kuris turėtų parodyti, kad bandomoji grupė iš esmės skiriasi nuo kontrolinės. Todėl statistiškai reikšmingo skirtumo tarp imčių buvimas ar nebuvimas yra naudojami specialūs statistiniai metodai, vadinami statistinio reikšmingumo kriterijais.

Visi kriterijai skirstomi į dvi grupes: parametrinius ir neparametrinius. Parametriniai kriterijai numato privalomą normalaus skirstinio dėsnio buvimą, t.y. tai reiškia privalomą pagrindinių normaliojo dėsnio rodiklių – aritmetinio vidurkio ir standartinio nuokrypio s – nustatymą. Parametriniai kriterijai yra tiksliausi ir teisingiausi. Neparametriniai kriterijai yra pagrįsti rango (eilės) skirtumais tarp imčių elementų.

Štai pagrindiniai statistinio reikšmingumo kriterijai, naudojami FCC praktikoje: Studento testas ir Fišerio testas.

Studento kriterijus pavadintas anglų mokslininko C. Gosseto (Student – ​​pseudonimas) vardu, kuris atrado šis metodas. Stjudento t testas yra parametrinis, naudojamas palyginimui absoliutūs rodikliai pavyzdžiai. Mėginiai gali būti skirtingo dydžio.

Studento kriterijus yra apibrėžtas taip.

1. Studento kriterijų t randame pagal formulę:


kur yra lyginamų imčių aritmetiniai vidurkiai; t 1 , t 2 - reprezentatyvumo paklaidos, nustatytos remiantis lyginamų imčių rodikliais.

2. FCC praktika parodė, kad sportiniam darbui užtenka priimti balo P = 0,95 patikimumą.

Skaičiavimo patikimumui: P = 0,95 (a = 0,05), su laisvės laipsnių skaičiumi

k \u003d n 1 + p 2 - 2 pagal 4 priedo lentelę randame kriterijaus ribinės vertės ( t gr).

3. Remiantis normaliojo skirstinio dėsnio savybėmis, Stjudento kriterijus lygina t ir t gr.

Darome išvadas:

jei t t gr, tai skirtumas tarp lyginamų imčių yra statistiškai reikšmingas;

jei t t gr, tai skirtumas statistiškai nereikšmingas.

FCC srities mokslininkams statistinio reikšmingumo įvertinimas yra pirmas žingsnis sprendžiant konkrečią problemą: ar palygintos imtys skiriasi iš esmės, ar ne. Kitas žingsnis – įvertinti šį skirtumą pedagoginiu požiūriu, kurį lemia problemos būklė.

Apsvarstykite Mokinio kriterijaus taikymą konkrečiame pavyzdyje.

2.14 pavyzdys. 18 asmenų grupei buvo įvertintas širdies susitraukimų dažnis (bpm) prieš x i ir po jo. y i apšilimai.

Įvertinkite apšilimo efektyvumą pagal širdies ritmą. Pradiniai duomenys ir skaičiavimai pateikti lentelėje. 2.30 ir 2.31 val.

2.30 lentelė

Apdorojami širdies ritmo duomenys prieš apšilimą


Abiejų grupių paklaidos sutapo, nes imties dydžiai yra vienodi (ta pati grupė tiriama skirtingomis sąlygomis), o standartiniai nuokrypiai buvo s x = s y = 3 k./min. Pereikime prie Studento kriterijaus apibrėžimo:

Nustatome sąskaitos patikimumą: Р= 0,95.

Laisvės laipsnių skaičius k 1 \u003d n 1 + p 2 - 2 \u003d 18 + 18-2 \u003d 34. Pagal 4 priedo lentelę randame t gr= 2,02.

Statistinė išvada. Kadangi t \u003d 11,62, o riba t gr \u003d 2,02, tai 11,62\u003e 2,02, t.y. t > t gr, todėl skirtumas tarp imčių yra statistiškai reikšmingas.

pedagoginė išvada. Nustatyta, kad pagal širdies ritmą skirtumas tarp grupės būklės prieš ir po apšilimo yra statistiškai reikšmingas, t.y. reikšmingas, svarbus. Taigi pagal pulso rodiklį galime daryti išvadą, kad apšilimas yra efektyvus.

Fisherio kriterijus yra parametrinis. Jis naudojamas lyginant mėginių sklaidos greitį. Tai, kaip taisyklė, reiškia palyginimą pagal sportinio darbo stabilumą arba funkcinių ir techninių rodiklių stabilumą praktikoje. fizinis lavinimas ir sportas. Mėginiai gali būti įvairaus dydžio.

Fisher kriterijus apibrėžiamas tokia seka.

1. Pagal formulę raskite Fišerio kriterijų F


kur , yra lyginamų imčių dispersijos.

Fišerio kriterijaus sąlygos numato, kad formulės skaitiklyje F yra didelė dispersija, t.y. F visada didesnis už vieną.

Nustatome sąskaitos patikimumą: P = 0,95 - ir nustatome abiejų pavyzdžių laisvės laipsnių skaičių: k 1 = n 1 - 1, k 2 = n 2 - 1.

Pagal 4 priedo lentelę randame kriterijaus F ribinę reikšmę gr.

F ir F kriterijų palyginimas gr leidžia padaryti tokias išvadas:

jei F > F gr, tai skirtumas tarp imčių yra statistiškai reikšmingas;

jei F< F гр, то различие между выборками статически недо­стоверно.

Paimkime konkretų pavyzdį.

2.15 pavyzdys. Išanalizuokime dvi rankininkų grupes: x i (n 1= 16 žmonių) ir y i (n 2 = 18 žmonių). Šioms sportininkų grupėms buvo tiriamas atstūmimo laikas (-iai) metant kamuolį į vartus.

Ar atstūmimo rodikliai vienodi?

Pradiniai duomenys ir pagrindiniai skaičiavimai pateikti lentelėje. 2,32 ir 2,33.

2.32 lentelė

Pirmos grupės rankininkų atstūmimo rodiklių apdorojimas


Apibrėžkime Fišerio kriterijų:





Pagal 6 priedo lentelėje pateiktus duomenis randame Fgr: Fgr = 2,4

Atkreipkime dėmesį į tai, kad 6 priedo lentelėje pateikiamas tiek didesnės, tiek mažesnės sklaidos laisvės laipsnių skaičius artėjant dideli skaičiai tampa grubesnis. Taigi, didesnės dispersijos laisvės laipsnių skaičius yra tokia tvarka: 8, 9, 10, 11, 12, 14, 16, 20, 24 ir tt, o mažesnio - 28, 29, 30, 40, 50 ir tt d.

Tai paaiškinama tuo, kad padidėjus imties dydžiui, gali būti naudojami F-testo skirtumai ir lentelės vertės, kurios yra artimos pradiniams duomenims. Taigi, pavyzdyje 2.15 =17 nėra ir galime paimti arčiausiai jai esančią reikšmę k = 16, iš kurios gauname Fgr = 2.4.

Statistinė išvada. Kadangi Fišerio testas F= 2,5 > F= 2,4, imtys yra statistiškai reikšmingos.

pedagoginė išvada. Abiejų grupių rankininkų atstūmimo laiko (-ų) reikšmės metant kamuolį į vartus labai skiriasi. Šios grupės turėtų būti laikomos skirtingomis.

Tolesni tyrimai turėtų parodyti, kokia šio skirtumo priežastis.

2.20 pavyzdys.(apie imties statistinį reikšmingumą ). Ar pakilo futbolininko kvalifikacija, jei laikas (-ai) nuo signalo davimo iki kamuolio smūgiavimo treniruotės pradžioje buvo x i , o pabaigoje – i .

Pradiniai duomenys ir pagrindiniai skaičiavimai pateikti lentelėje. 2.40 ir 2.41.

2.40 lentelė

Laiko rodiklių apdorojimas nuo signalo davimo iki kamuolio smūgio treniruotės pradžioje


Nustatykime skirtumą tarp rodiklių grupių pagal Studento kriterijų:

Esant patikimumui P \u003d 0,95 ir laisvės laipsniams k \u003d n 1 + n 2 - 2 \u003d 22 + 22 - 2 \u003d 42, pagal 4 priedo lentelę randame t gr= 2,02. Kadangi t = 8,3 > t gr= 2,02 – skirtumas statistiškai reikšmingas.

Nustatykime skirtumą tarp rodiklių grupių pagal Fisher kriterijų:


Pagal 2 priedo lentelę, kai patikimumas P = 0,95 ir laisvės laipsniai k = 22-1 = 21, F gr = 21 reikšmė. Kadangi F = 1,53< F гр = = 2,1, различие в рассеивании исходных данных статистически недостоверно.

Statistinė išvada. Pagal aritmetinį vidurkį skirtumas tarp rodiklių grupių yra statistiškai reikšmingas. Kalbant apie sklaidą (sklaidą), skirtumas tarp rodiklių grupių nėra statistiškai reikšmingas.

pedagoginė išvada. Futbolininko kvalifikacija gerokai pagerėjo, tačiau reikėtų atkreipti dėmesį į jo parodymų stabilumą.

Pasiruošimas darbui

Prieš tai laboratoriniai darbai disciplinoje „Sportinė metrologija“ visiems studentams studijų grupė būtina sudaryti darbo komandas po 3-4 studentus, bendrai atlikti visų laboratorinių darbų darbo užduotį.

Ruošiantis darbui susipažinti su atitinkamais rekomenduojamos literatūros skyriais (žr. šių rekomendacijų 6 skyrių) ir paskaitų konspektais. Išstudijuokite šios laboratorijos 1 ir 2 skyrius, taip pat jos darbo užduotį (4 skyrius).

Paruoškite ataskaitos formą ant standartinių A4 formato rašomojo popieriaus lapų ir įdėti į jį darbui reikalingas medžiagas.

Ataskaitoje turi būti :

Titulinis puslapis nurodant katedrą (UK ir TR), studijų grupę, studento pavardę, vardą, patronimą, laboratorinio darbo numerį ir pavadinimą, jo atlikimo datą, taip pat pavardę, mokslo laipsnį, akademinį vardą ir pareigas. mokytojo, priimančio darbą;

Tikslas;

Formulės su skaitinėmis reikšmėmis, kurios paaiškina tarpinius ir galutinius skaičiavimų rezultatus;

Išmatuotų ir apskaičiuotų verčių lentelės;

Užduočiai reikalinga grafinė medžiaga;

Trumpos išvados apie kiekvieno darbo užduoties etapo rezultatus ir apskritai apie atliktus darbus.

Visi grafikai ir lentelės nubraižytos tiksliai naudojant piešimo priemones. Sąlyginiai grafiniai ir abėcėliniai žymėjimai turi atitikti GOST. Leidžiama surašyti ataskaitą naudojant kompiuterinę (kompiuterinę) technologiją.

Darbo užduotis

Prieš atlikdamas visus matavimus, kiekvienas komandos narys turi išstudijuoti naudojimo taisykles sportinis žaidimas Smiginis, pateiktas 7 priede, kuris yra būtinas tolesniems tyrimo etapams.

I – tyrimo etapas„Kiekvieno brigados nario sportinio žaidimo „Smiginio“ taikinio rezultatų tyrimas, kad būtų laikomasi normalaus paskirstymo įstatymo pagal kriterijų. χ 2 Pearsonas ir trijų sigmų testas“

1. išmatuokite (išbandykite) savo (asmeninį) greitį ir veiksmų koordinavimą, metant smiginį 30-40 kartų į apskritą sportinio žaidimo Smiginis taikinį.

2. Matavimų (bandymų) rezultatai x i(taškais) išdėstyti variacinių eilučių forma ir įrašyti į 4.1 lentelę (stulpeliai , atlikti visus reikiamus skaičiavimus, užpildyti reikiamas lenteles ir padaryti atitinkamas išvadas dėl gauto empirinio skirstinio atitikimo normaliojo skirstinio dėsniui, pagal analogiją su panašiais 2.12 pavyzdžio skaičiavimais, lentelėmis ir išvadomis, pateiktomis šių gairių 2 skirsnyje 7–10 puslapiuose.

4.1 lentelė

Subjektų veiksmų greičio ir koordinacijos atitikimas normalaus skirstymo dėsniui

Nr. p / p suapvalinti
Iš viso

II – tyrimo etapas

„Visų ugdymo grupės mokinių sportinio žaidimo „Smiginis“ taikinio bendrosios populiacijos vidutinių rodiklių vertinimas remiantis vienos brigados narių matavimų rezultatais.

Įvertinkite visų tiriamosios grupės mokinių (pagal klasės žurnalo tiriamosios grupės sąrašą) greitumo ir veiksmų koordinavimo rodiklius, remdamiesi sporto žaidimo „Smiginis“ taikinio rezultatais, kai visi mokinių nariai pataikė į taikinį. komanda, gauta pirmajame šio laboratorinio darbo tyrimo etape.

1. Dokumentuoti greičio matavimų ir veiksmų koordinavimo rezultatus metant smiginį į apskritą sportinio žaidimo taikinį Smiginis visų savo komandos narių (2 - 4 žmonės), kurie yra matavimo rezultatų atranka iš bendros populiacijos (visų tiriamosios grupės mokinių matavimo rezultatai, pvz. 15 žmonių), įrašant juos į antrą ir trečią lentelių stulpelius 4.2.

4.2 lentelė

Greitumo ir veiksmų koordinavimo rodiklių apdorojimas

brigados nariai

Nr. p / p
Iš viso

4.2 lentelė žemiau reikėtų suprasti , atitiko vidutinį balą (žr. skaičiavimų rezultatus pagal 4.1 lentelę) jūsų komandos nariai , gautas pirmajame tyrimo etape. Reikėtų pažymėti, kad paprastai, 4.2 lentelėje yra skaičiuojama vieno komandos nario pirmajame tyrimo etape gautų matavimų rezultatų vidutinė vertė , nes tikimybė, kad skirtingų komandos narių matavimų rezultatai sutaps, yra labai maža. Tada dažniausiai vertybes stulpelyje 4.2 lentelės kiekvienai eilutei yra lygūs 1, a eilutėje „Iš viso parašyta » stulpeliai « » jūsų komandos narių skaičius.

2. Atlikite visus reikiamus skaičiavimus, kad užpildytumėte 4.2 lentelę, taip pat kitus skaičiavimus ir išvadas, panašias į 2.13 pavyzdžio skaičiavimus ir išvadas, pateiktus šio straipsnio 2 dalyje. metodinė plėtra 13-14 puslapiuose. Į tai reikia atsižvelgti skaičiuojant reprezentatyvumo paklaidą "m" būtina naudoti 2.4 formulę, pateiktą šios metodinės plėtros 13 puslapyje, nes imtis nedidelė (n, o bendrosios visumos elementų skaičius N yra žinomas ir lygus tiriamosios grupės mokinių skaičiui , pagal tiriamosios grupės žurnalo sąrašą.

III – tyrimo etapas

Kiekvieno komandos nario apšilimo efektyvumo įvertinimas „greitis ir veiksmų koordinavimas“ pagal studento kriterijų.

Įvertinti kiekvieno komandos nario apšilimo metant smiginį į sportinio žaidimo „Smiginis“ taikinį, atlikto pirmame šio laboratorinio darbo tyrimo etape, efektyvumą pagal „Greitį ir veiksmų koordinavimas“, naudojant Stjudento kriterijų – empirinio skirstinio dėsnio statistinio patikimumo normaliojo skirstinio dėsniui parametrinį kriterijų .

… Iš viso

2. dispersija ir Šiaurės Kazachstanas , rodiklio „Greitis ir veiksmų koordinavimas“ matavimų rezultatai, pagrįsti apšilimo rezultatais, pateikta 4.3 lentelėje, (žr. panašius skaičiavimus, pateiktus iš karto po 2.14 pavyzdžio 2.30 lentelės šio metodinio tobulinimo 16 puslapyje).

3. Kiekvienas darbo komandos narys išmatuokite (išbandykite) savo (asmeninį) greitį ir veiksmų koordinavimą po apšilimo,

… Iš viso

5. Atlikite vidutinius skaičiavimus dispersija ir Šiaurės Kazachstanas ,rodiklio „Greitis ir veiksmų koordinavimas“ matavimų rezultatai po apšilimo, pateikta 4.4 lentelėje, užrašykite bendrą matavimų rezultatą pagal apšilimo rezultatus (žr. panašius skaičiavimus, pateiktus iškart po 2.14 pavyzdžio 2.31 lentelės šios metodikos kūrimo 17 puslapyje).

6. Atlikite visus reikiamus skaičiavimus ir išvadas, panašius į 2.14 pavyzdžio skaičiavimus ir išvadas, pateiktus 2-ame šio metodinio tobulinimo skyriuje 16-17 puslapiuose. Į tai reikia atsižvelgti skaičiuojant reprezentatyvumo paklaidą "m" būtina naudoti 2.1 formulę, pateiktą šios metodinės plėtros 12 puslapyje, nes imtis yra n, o populiacijos elementų skaičius N ( nežinomas.

IV – tyrimo etapas

Dviejų komandos narių rodiklių „Greitis ir veiksmų koordinavimas“ vienodumo (stabilumo) įvertinimas naudojant Fisher kriterijų

Įvertinkite dviejų komandos narių rodiklių „Greitis ir veiksmų koordinavimas“ vienodumą (stabilumą) pagal Fisher kriterijų pagal matavimo rezultatus, gautus trečiajame šio laboratorinio darbo tyrimo etape.

Norėdami tai padaryti, atlikite šiuos veiksmus.

Naudojantis 4.3 ir 4.4 lentelių duomenimis, šių lentelių dispersijų skaičiavimo rezultatai, gauti trečiajame tyrimo etape, bei Fišerio kriterijaus apskaičiavimo ir taikymo sporto rodiklių vienodumui (stabilumui) vertinti metodika, pateiktą 2.15 pavyzdyje šios metodinės plėtros 18-19 puslapiuose, padaryti atitinkamas statistines ir pedagogines išvadas.

V – tyrimo etapas

Vieno komandos nario rodiklių grupių „Greitis ir veiksmų koordinavimas“ įvertinimas prieš ir po apšilimo

3 užduotis. Penkiems ikimokyklinukams pateikiamas testas. Kiekvienos užduoties sprendimo laikas yra fiksuotas. Ar bus statistiškai reikšmingų skirtumų tarp trijų pirmųjų testo užduočių sprendimo laiko?

Dalykų skaičius

Pamatinė medžiaga

Ši užduotis pagrįsta dispersinės analizės teorija. Bendruoju atveju dispersinės analizės uždavinys yra nustatyti tuos veiksnius, kurie turi reikšmingos įtakos eksperimento rezultatui. Dispersijos analizė gali būti naudojama kelių imčių vidurkiams palyginti, jei imčių skaičius yra didesnis nei du. Šiuo tikslu naudojama vienpusė dispersijos analizė.

Norint išspręsti iškeltas užduotis, priimama toliau nurodyta. Jei optimizavimo parametro gautų verčių dispersijos veiksnių įtakos atveju skiriasi nuo rezultatų dispersijos, kai nėra veiksnių įtakos, toks veiksnys pripažįstamas reikšmingu.

Kaip matyti iš problemos formuluotės, čia naudojami statistinių hipotezių tikrinimo metodai, būtent dviejų empirinių dispersijų tikrinimo problema. Todėl dispersijos analizė yra pagrįsta dispersijų patikrinimu Fišerio kriterijumi. Atliekant šią užduotį, reikia patikrinti, ar skirtumai tarp laiko, per kurį kiekvienas iš šešių ikimokyklinukų atliko pirmąsias tris testo užduotis, yra statistiškai reikšmingi.

Nulinė (pagrindinė) hipotezė vadinama H o. E esmė redukuojama iki prielaidos, kad skirtumas tarp lyginamų parametrų lygus nuliui (taigi ir hipotezės pavadinimas – nulis) ir kad stebimi skirtumai yra atsitiktiniai.

Konkuruojanti (alternatyvi) hipotezė vadinama H 1 , kuri prieštarauja nulinei.

Sprendimas:

Naudodami dispersinės analizės metodą, kai reikšmingumo lygis α = 0,05, patikrinsime nulinę hipotezę (Hо) apie statistiškai reikšmingų skirtumų egzistavimą tarp pirmųjų trijų testo užduočių sprendimo laiko šešiuose ikimokyklinukuose.

Apsvarstykite užduoties sąlygų lentelę, kurioje randame vidutinį kiekvienos iš trijų testo užduočių sprendimo laiką

Dalykų skaičius

Faktorių lygiai

Laikas išspręsti pirmąją testo užduotį (sek.).

Laikas išspręsti antrąją testo užduotį (sek.).

Laikas išspręsti trečiąją testo užduotį (sek.).

Grupės vidurkis

Kaip rasti bendrą vidurkį:

Siekiant atsižvelgti į kiekvieno testo laiko skirtumų reikšmingumą, bendra imties dispersija yra padalinta į dvi dalis, iš kurių pirmoji vadinama faktorine, o antroji – liekana.

Apskaičiuokite bendrą varianto kvadratinių nuokrypių sumą nuo bendro vidurkio pagal formulę

arba , kur p – laiko matavimų, skirtų testo užduotims spręsti, skaičius, q – tiriamųjų skaičius. Norėdami tai padaryti, sudarysime kvadratų lentelės parinktį

Dalykų skaičius

Faktorių lygiai

Laikas išspręsti pirmąją testo užduotį (sek.).

Laikas išspręsti antrąją testo užduotį (sek.).

Laikas išspręsti trečiąją testo užduotį (sek.).

Kaip manai, kuo tavo „sielos draugas“ ypatingas, reikšmingas? Ar tai susiję su jos (jo) asmenybe, ar su jūsų jausmais šiam žmogui? O gal su paprastu faktu, kad tyrimai rodo, jog hipotezė, kad tavo simpatija yra atsitiktinė, tikimybė yra mažesnė nei 5%? Jei laikytume paskutinį teiginį patikimu, sėkmingų pažinčių svetainių iš esmės nebūtų:

Kai atliekate dalinį testavimą ar bet kokią kitą savo svetainės analizę, klaidingas „statistinės reikšmės“ supratimas gali lemti klaidingą rezultatų interpretavimą, todėl klaidingi veiksmai konversijos optimizavimo procese. Tai pasakytina apie tūkstančius kitų statistinių testų, kasdien atliekamų bet kurioje esamoje pramonės šakoje.

Norėdami suprasti, kas yra „statistinė reikšmė“, turite pasinerti į šio termino atsiradimo istoriją, ją žinoti tikroji prasmė ir suprasti, kaip šis „naujas“ senas supratimas padės teisingai interpretuoti tyrimo rezultatus.

Truputis istorijos

Nors žmonija daugelį amžių naudojo statistiką tam tikroms problemoms spręsti, šiuolaikinis supratimas statistinis reikšmingumas, hipotezių tikrinimas, atsitiktinių imčių ir netgi eksperimentų planavimas (Design of Experiments (DOE) pradėjo formuotis tik XX a. pradžioje ir yra neatsiejamai susijęs su sero Ronaldo Fišerio vardu (Sir Ronald Fisher, 1890-1962). ):

Ronaldas Fišeris buvo evoliucijos biologas ir statistikas, kuriam buvo ypatinga aistra evoliucijos ir evoliucijos tyrimams. natūrali atranka gyvūnuose ir flora. Per savo puikią karjerą jis sukūrė ir išpopuliarino daug naudingų statistikos priemonių, kurias naudojame ir šiandien.

Fisheris naudojo savo sukurtus metodus, kad paaiškintų tokius biologijos procesus kaip dominavimas, mutacija ir genetinė variacija. Šiuos pačius įrankius galime pritaikyti ir šiandien optimizuodami ir tobulindami žiniatinklio išteklių turinį. Tai, kad šios analizės priemonės gali būti naudojamos dirbant su objektais, kurių kūrimo metu net neegzistavo, atrodo gana stebina. Ne mažiau stebina tai, kad žmonės sudėtingiausius skaičiavimus atlikdavo be skaičiuotuvų ar kompiuterių.

Norėdamas apibūdinti statistinio eksperimento rezultatus kaip turinčius didelę tikimybę, kad jie yra teisingi, Fisheris panaudojo žodį reikšmingumas.

Be to, vienas iš įdomiausių Fisherio įvykių yra „seksualaus sūnaus“ hipotezė. Remiantis šia teorija, moterys pirmenybę teikia pasileidusiems vyrams (vaikščiotojams), nes tai leis iš šių vyrų gimusiems sūnums turėti tokį patį polinkį ir susilaukti daugiau savo palikuonių (atkreipkite dėmesį, kad tai tik teorija).

Tačiau niekas, net ir puikūs mokslininkai, nėra apsaugotas nuo klaidų. Fišerio trūkumai specialistus erzina iki šiol. Tačiau prisiminkite Alberto Einšteino žodžius: „Tas, kuris niekada nepadarė klaidos, niekada nieko naujo nesukūrė“.

Prieš pereinant prie kito punkto, atminkite, kad statistinis reikšmingumas yra situacija, kai testavimo rezultatų skirtumas yra toks didelis, kad šio skirtumo negalima paaiškinti atsitiktinių veiksnių įtaka.

Kokia tavo hipotezė?

Norėdami suprasti, ką reiškia „statistiškai reikšmingas“, pirmiausia turite suprasti, kas yra „hipotezių tikrinimas“, nes šie du terminai yra glaudžiai susiję.
Hipotezė yra tik teorija. Sukūrę teoriją, turėsite nustatyti pakankamai įrodymų surinkimo tvarką ir iš tikrųjų surinkti šiuos įrodymus. Yra dviejų tipų hipotezės.

Obuoliai ar apelsinai – kas geriau?

Nulinė hipotezė

Kaip taisyklė, būtent šioje vietoje daugelis patiria sunkumų. Turite nepamiršti, kad nulinė hipotezė nėra kažkas, ko reikia įrodyti, pavyzdžiui, jūs įrodote, kad tam tikras svetainės pakeitimas padidins konversiją, bet atvirkščiai. Nulinė hipotezė yra teorija, teigianti, kad jei atliksite kokių nors svetainės pakeitimų, nieko neatsitiks. O mokslininko tikslas yra paneigti šią teoriją, o ne įrodyti.

Jei atsigręžtume į nusikaltimų atskleidimo patirtį, kai tyrėjai taip pat kelia hipotezes apie tai, kas yra nusikaltėlis, nulinė hipotezė pasireiškia vadinamosios nekaltumo prezumpcijos forma, koncepcija, kad kaltinamasis laikomas nekaltu, kol jo kaltė neįrodyta teisme.

Jei nulinė hipotezė yra ta, kad du objektai yra vienodi savo savybėmis, o jūs bandote įrodyti, kad vienas iš jų vis tiek yra geresnis (pavyzdžiui, A yra geresnis už B), turite atsisakyti nulinės hipotezės alternatyvos naudai. vienas. Pavyzdžiui, lyginate vieną ar kitą konversijų optimizavimo įrankį tarpusavyje. Nulinės hipotezės atveju jie abu turi tokį patį poveikį taikiniui (arba neturi jokio poveikio). Kitu atveju vieno iš jų poveikis yra geresnis.

Jūsų alternatyvioje hipotezėje gali būti skaitinė reikšmė, pvz., B – A > 20%. Šiuo atveju nulinė hipotezė ir alternatyva gali būti tokios formos:

Kitas alternatyvios hipotezės pavadinimas yra tyrimo hipotezė, nes tyrėjui visada įdomu įrodyti šią konkrečią hipotezę.

Statistinis reikšmingumas ir "p" reikšmė

Grįžkime prie Ronaldo Fisherio ir jo statistinio reikšmingumo sampratos.

Dabar, kai turite nulinę hipotezę ir alternatyvą, kaip galite įrodyti vieną ir paneigti kitą?

Kadangi statistika pagal savo pobūdį apima tam tikros populiacijos (imties) tyrimą, niekada negalite būti 100% tikri dėl gautų rezultatų. Aiškus pavyzdys: rinkimų rezultatai dažnai skiriasi nuo preliminarių apklausų ir net pasitraukimo grupių rezultatų.

Dr. Fisher norėjo sukurti skiriamąją liniją, kuri leistų jums žinoti, ar jūsų eksperimentas buvo sėkmingas, ar ne. Taip atsirado pasitikėjimo indeksas. Patikimumas – tai lygis, kuriuo galime pasakyti, ką laikome „prasminga“, o kas ne. Jei „p“, pasitikėjimo indeksas, yra 0,05 arba mažesnis, tada rezultatai yra reikšmingi.

Nesijaudinkite, tai tikrai nėra taip painu, kaip atrodo.

Gauso tikimybių skirstinys. Kraštuose - mažiau tikėtinos kintamojo reikšmės, centre - labiausiai tikėtinos. P balas (žaliai užtemdyta sritis) yra tikimybė, kad pastebėtas rezultatas įvyks atsitiktinai.

Normalusis tikimybių pasiskirstymas (Gauso skirstinys) yra visko atvaizdas galimas vertes kai kurie kintamieji grafike (paveikslėlyje aukščiau) ir jų dažniai. Jei tyrimą atliksite teisingai ir visus gautus atsakymus pavaizduosite grafike, gausite būtent tokį pasiskirstymą. Pagal įprastą pasiskirstymą gausite didelį procentą panašių atsakymų, o likusios parinktys bus išsidėsčiusios grafiko kraštuose (vadinamosiose „uodegose“). Toks kiekių pasiskirstymas gamtoje sutinkamas dažnai, todėl jis vadinamas „normaliu“.

Naudodami lygtį, pagrįstą jūsų imties ir bandymo rezultatais, galite apskaičiuoti vadinamąją „bandymo statistiką“, kuri parodo, kiek rezultatai nukrypo. Tai taip pat parodys, kiek esate arti nulinės hipotezės teisingumo.

Kad nenuleistumėte galvos, statistiniam reikšmingumui apskaičiuoti naudokite internetinius skaičiuotuvus:

Vienas tokių skaičiuoklių pavyzdžių

Raidė „p“ reiškia tikimybę, kad nulinė hipotezė yra teisinga. Jei skaičius yra mažas, tai reikštų skirtumą tarp bandomųjų grupių, o nulinė hipotezė būtų tokia, kad jos yra vienodos. Grafiškai atrodys, kad jūsų bandymo statistika yra arčiau vienos iš jūsų varpelių pasiskirstymo uodegų.

Daktaras Fischeris nusprendė nustatyti rezultatų pasitikėjimo slenkstį p ≤ 0,05. Tačiau šis teiginys taip pat yra prieštaringas, nes sukelia du sunkumus:

1. Pirma, tai, kad įrodėte nulinę hipotezę neteisingą, nereiškia, kad įrodėte alternatyvią hipotezę. Visa ši reikšmė tiesiog reiškia, kad jūs negalite įrodyti nei A, nei B.

2. Antra, jei p reikšmė lygi 0,049, tai reikš, kad nulinės hipotezės tikimybė bus 4,9%. Tai gali reikšti, kad tuo pačiu metu jūsų tyrimo rezultatai gali būti ir teisingi, ir klaidingi.

Galite naudoti p reikšmę arba ne, bet tada kiekvienu atskiru atveju turėsite apskaičiuoti nulinės hipotezės tikimybę ir nuspręsti, ar ji pakankamai didelė, kad neatliktumėte planuotų ir patikrintų pakeitimų.

Dažniausias scenarijus atliekant statistinį testą šiandien yra nustatyti p ≤ 0,05 reikšmingumo slenkstį prieš atliekant tikrąjį testą. Tik nepamirškite atidžiai išnagrinėti p reikšmę tikrindami rezultatus.

1 ir 2 klaidos

Praėjo tiek laiko, kad klaidos, kurios gali atsirasti naudojant statistinio reikšmingumo matą, net gavo savo pavadinimus.

1 klaida (1 tipo klaidos)

Kaip minėta aukščiau, p reikšmė 0,05 reiškia, kad yra 5% tikimybė, kad nulinė hipotezė yra teisinga. Jei to nepadarysite, darote klaidą 1. Rezultatai rodo, kad jūsų naujoji svetainė padidino konversijų rodiklius, tačiau yra 5 % tikimybė, kad taip nėra.

2 klaida (2 tipo klaidos)

Ši klaida yra priešinga 1 klaidai: jūs priimate nulinę hipotezę, kai ji klaidinga. Pavyzdžiui, bandymų rezultatai rodo, kad svetainėje atlikti pakeitimai neatnešė jokių patobulinimų, o pakeitimai buvo. Dėl to: praleidžiate galimybę padidinti savo našumą.

Ši klaida dažnai pasitaiko atliekant bandymus su nepakankamo imties dydžiu, todėl atminkite, kad kuo didesnė imtis, tuo patikimesnis rezultatas.

Išvada

Galbūt joks terminas tarp tyrinėtojų nėra toks populiarus kaip statistinis reikšmingumas. Kai testų rezultatai nėra laikomi statistiškai reikšmingais, pasekmės svyruoja nuo konversijų rodiklių padidėjimo iki įmonės žlugimo.

Kadangi rinkodaros specialistai naudoja šį terminą optimizuodami savo išteklius, turite žinoti, ką tai iš tikrųjų reiškia. Bandymo sąlygos gali keistis, tačiau imties dydis ir sėkmės kriterijai visada yra svarbūs. Prisimink tai.

Statistikos reikšmingumo lygis yra svarbus rodiklis, atspindintis pasitikėjimo gautų (numatytų) duomenų tikslumu, tikrumu laipsnį. Ši sąvoka plačiai naudojama įvairiose srityse: iš valdos sociologiniai tyrimai, statistiniam mokslinių hipotezių tikrinimui.

Apibrėžimas

Statistinio reikšmingumo lygis (arba statistiškai reikšmingas rezultatas) parodo, kokia yra tiriamų rodiklių atsitiktinio atsiradimo tikimybė. Bendras statistinis reiškinio reikšmingumas išreiškiamas p reikšme (p lygiu). Bet kurio eksperimento ar stebėjimo metu yra tikimybė, kad gauti duomenys atsirado dėl atrankos klaidų. Tai ypač pasakytina apie sociologiją.

Tai reiškia, kad reikšmė yra statistiškai reikšminga, kurios atsitiktinio pasireiškimo tikimybė yra labai maža arba linkusi į kraštutinumus. Kraštutinis šiame kontekste yra statistikos nukrypimo nuo nulinės hipotezės laipsnis (hipotezė, kuri tikrinama, ar ji atitinka gautus imties duomenis). Mokslinėje praktikoje reikšmingumo lygis pasirenkamas prieš renkant duomenis ir, kaip taisyklė, jo koeficientas yra 0,05 (5%). Sistemoms, kuriose tai labai svarbu tikslios vertės, šis rodiklis gali būti 0,01 (1%) arba mažesnis.

Fonas

Reikšmingumo lygio sąvoką 1925 m. įvedė britų statistikas ir genetikas Ronaldas Fisheris, kurdamas statistinių hipotezių tikrinimo techniką. Analizuojant bet kokį procesą, yra tam tikra tam tikrų reiškinių tikimybė. Sunkumai kyla dirbant su mažomis (arba neaiškiomis) tikimybės procentais, kurios patenka į „matavimo paklaidos“ sąvoką.

Dirbdami su statistika, kuri nebuvo pakankamai specifinė, kad būtų galima patikrinti, mokslininkai susidūrė su nulinės hipotezės problema, kuri „neleidžia“ veikti su mažomis reikšmėmis. Fisher pasiūlė tokioms sistemoms nustatyti įvykių tikimybę esant 5% (0,05), kaip patogią imties ribą, leidžiančią atmesti nulinę hipotezę skaičiavimuose.

Fiksuoto koeficiento įvedimas

1933 metais Jerzy mokslininkai Neumannas ir Egonas Pearsonas savo darbuose rekomendavo nustatyti iš anksto (prieš renkant duomenis) tam tikras lygis reikšmę. Šių taisyklių naudojimo pavyzdžiai aiškiai matomi per rinkimus. Tarkime, yra du kandidatai, iš kurių vienas yra labai populiarus, o kitas mažai žinomas. Akivaizdu, kad pirmasis kandidatas laimės rinkimus, o antrojo šansai linkę nuliui. Stenkitės – bet ne lygiaverčiai: visada yra force majeure, sensacingos informacijos, netikėtų sprendimų, galinčių pakeisti prognozuojamus rinkimų rezultatus, galimybė.

Neumannas ir Pearsonas sutiko, kad Fišerio pasiūlytas 0,05 reikšmingumo lygis (žymimas simboliu α) yra patogiausias. Tačiau pats Fischeris 1956 m. nepritarė šios vertės fiksavimui. Jis manė, kad α lygis turėtų būti nustatytas atsižvelgiant į konkrečias aplinkybes. Pavyzdžiui, dalelių fizikoje jis yra 0,01.

p-reikšmė

Terminą p vertė pirmą kartą panaudojo Brownlee 1960 m. P lygis (p vertė) yra rodiklis, randamas atvirkštinis ryšys dėl rezultatų pagrįstumo. Didžiausia p reikšmė atitinka mažiausią patikimumo lygį imties santykiu tarp kintamųjų.

Ši reikšmė atspindi klaidų, susijusių su rezultatų interpretavimu, tikimybę. Tarkime, p reikšmė = 0,05 (1/20). Tai rodo penkių procentų tikimybę, kad ryšys tarp imtyje rastų kintamųjų yra tik atsitiktinė imties ypatybė. Tai yra, jei šios priklausomybės nėra, tada pakartotinai atliekant panašius eksperimentus, vidutiniškai kas dvidešimtame tyrime, galima tikėtis tokios pačios arba didesnės priklausomybės tarp kintamųjų. Dažnai p lygis laikomas klaidos lygio „marža“.

Beje, p reikšmė gali neatspindėti tikrojo ryšio tarp kintamųjų, o tik parodo tam tikrą vidutinę reikšmę prielaidų ribose. Visų pirma galutinė duomenų analizė taip pat priklausys nuo pasirinktų šio koeficiento verčių. Kai p-lygis = 0,05, bus vieni rezultatai, o kai koeficientas lygus 0,01, kiti.

Statistinių hipotezių tikrinimas

Statistinio reikšmingumo lygis ypač svarbus tikrinant hipotezes. Pavyzdžiui, skaičiuojant dvipusį testą, atmetimo plotas padalijamas po lygiai abiejuose atrankos skirstinio galuose (nulinės koordinatės atžvilgiu) ir apskaičiuojamas gautų duomenų teisingumas.

Tarkime, stebint tam tikrą procesą (reiškinį), paaiškėjo, kad nauja statistinė informacija rodo nedidelius pokyčius, palyginti su ankstesnėmis reikšmėmis. Tuo pačiu metu rezultatų neatitikimai yra nedideli, nėra akivaizdūs, tačiau svarbūs tyrimui. Specialistas susiduria su dilema: ar pokyčiai tikrai atsiranda, ar tai atrankos klaidos (matavimo netikslumas)?

Tokiu atveju pritaikoma arba atmetama nulinė hipotezė (viskas nurašoma kaip klaida, arba sistemos pasikeitimas pripažįstamas fait accompli). Problemos sprendimo procesas grindžiamas bendro statistinio reikšmingumo (p reikšmės) ir reikšmingumo lygio (α) santykiu. Jei p lygio< α, значит, нулевую гипотезу отвергают. Чем меньше р-value, тем более значимой является тестовая статистика.

Naudotos vertės

Reikšmingumo lygis priklauso nuo analizuojamos medžiagos. Praktikoje naudojamos šios fiksuotos vertės:

  • α = 0,1 (arba 10%);
  • α = 0,05 (arba 5%);
  • α = 0,01 (arba 1%);
  • α = 0,001 (arba 0,1 %).

Kuo tikslesni skaičiavimai reikalingi, tuo mažesnis koeficientas α naudojamas. Natūralu, kad statistinės prognozės fizikos, chemijos, farmacijos ir genetikos srityse reikalauja didesnio tikslumo nei politikos mokslų ir sociologijos srityse.

Reikšmingumo slenksčiai konkrečiose srityse

Didelio tikslumo srityse, tokiose kaip dalelių fizika ir gamyba, statistinis reikšmingumas dažnai išreiškiamas standartinio nuokrypio (žymimo sigma – σ koeficientu) santykiu, palyginti su normaliu tikimybių pasiskirstymu (Gauso skirstiniu). σ yra statistinis rodiklis, nustatantis tam tikro dydžio verčių sklaidą, palyginti su matematiniais lūkesčiais. Naudojamas įvykių tikimybei nubraižyti.

Priklausomai nuo žinių srities, koeficientas σ labai skiriasi. Pavyzdžiui, prognozuojant Higso bozono egzistavimą, parametras σ yra lygus penkiems (σ=5), o tai atitinka p-reikšmę=1/3,5 mln.sritis.

Efektyvumas

Reikia atsižvelgti į tai, kad koeficientai α ir p reikšmė nėra tikslios charakteristikos. Kad ir koks būtų reikšmingumo lygis tiriamo reiškinio statistikoje, tai nėra besąlyginis pagrindas hipotezei priimti. Pavyzdžiui, nei mažesnė vertėα, tuo didesnė tikimybė, kad hipotezė yra reikšminga. Tačiau yra klaidų rizika, dėl kurios sumažėja tyrimo statistinė galia (reikšmingumas).

Tyrėjai, kurie orientuojasi tik į statistiką prasmingus rezultatus gali padaryti klaidingas išvadas. Tuo pačiu metu sunku dar kartą patikrinti jų darbą, nes jie taiko prielaidas (kurios iš tikrųjų yra α ir p vertės). Todėl visada rekomenduojama kartu su statistinio reikšmingumo skaičiavimu nustatyti ir kitą rodiklį – statistinio efekto dydį. Poveikio dydis yra kiekybinis poveikio stiprumo matas.

Statistika jau seniai buvo neatsiejama gyvenimo dalis. Žmonės su tuo susiduria visur. Remiantis statistika, daromos išvados, kur ir kokios ligos yra dažnos, kas yra paklausesnė konkrečiame regione ar tarp tam tikros gyventojų grupės. Netgi konstrukcijos remiasi politines programas kandidatai į vyriausybę. Jais pirkdami prekes naudoja ir prekybos tinklai, šiais duomenimis savo pasiūlymuose vadovaujasi ir gamintojai.

Statistika vaidina svarbų vaidmenį visuomenės gyvenime ir daro įtaką kiekvienam atskiram jos nariui, net ir nedideliu būdu. Pavyzdžiui, jei iki , dauguma žmonių teikia pirmenybę tamsios spalvos drabužiuose konkrečiame mieste ar regione vietinėse prekybos vietose bus nepaprastai sunku rasti ryškiai geltoną lietpaltį su gėlių raštu. Bet kokie dydžiai sudaro šiuos duomenis, kurie turi tokį poveikį? Pavyzdžiui, kas yra „statistiškai reikšmingas“? Ką tiksliai reiškia šis apibrėžimas?

Kas tai?

Statistika kaip mokslas susideda iš įvairių dydžių ir sąvokų derinio. Viena iš jų – „statistinio reikšmingumo“ sąvoka. Tai yra kintamųjų reikšmės pavadinimas, kuriame kitų rodiklių atsiradimo tikimybė yra nereikšminga.

Pavyzdžiui, 9 iš 10 žmonių rytiniame pasivaikščiojime grybauti po lietingą naktį rudeniniame miške kojas užsimauna guminius batus. Tikimybė, kad kažkuriuo momentu 8 iš jų užsidėjo drobinius mokasinus, yra nereikšminga. Taigi, šiame konkrečiame pavyzdyje skaičius 9 yra reikšmė, kuri vadinama „statistiniu reikšmingumu“.

Atitinkamai, jei toliau plėtosime tai, kas išdėstyta aukščiau praktinis pavyzdys, batų parduotuvės iki vasaros sezono pabaigos guminius batus perka dideliais kiekiais nei kitu metų laiku. Taigi, statistinės vertės dydis turi įtakos įprastam gyvenimui.

Žinoma, atliekant sudėtingus skaičiavimus, pavyzdžiui, prognozuojant virusų plitimą, didelis skaičius kintamieji. Bet pati apibrėžimo esmė reikšmingas rodiklis statistiniai duomenys – yra panašūs, nepaisant skaičiavimų sudėtingumo ir nepastovių reikšmių skaičiaus.

Kaip jis apskaičiuojamas?

Naudojamas skaičiuojant lygties rodiklio „statistinis reikšmingumas“ reikšmę. Tai yra, galima teigti, kad šiuo atveju viską sprendžia matematika. daugiausia paprastas variantas skaičiavimas yra matematinių operacijų grandinė, kurioje dalyvauja šie parametrai:

  • dviejų tipų rezultatai, gauti atlikus apklausas arba tiriant objektyvius duomenis, pavyzdžiui, sumos, už kurias perkama, žymimos a ir b;
  • abiejų grupių rodiklis – n;
  • jungtinės imties dalies vertė - p;
  • „standartinės paklaidos“ sąvoka – SE.

Kitas žingsnis – nustatyti bendrą testo rodiklį – t, jo reikšmė lyginama su skaičiumi 1,96. 1,96 yra vidutinė vertė, atitinkanti 95 % intervalą pagal Stjudento t skirstinį.

Dažnai kyla klausimas, kuo skiriasi n ir p reikšmės. Šį niuansą lengva paaiškinti pavyzdžiu. Tarkime, apskaičiuojama vyrų ir moterų lojalumo bet kuriai prekei ar prekės ženklui statistinė reikšmė.

Tokiu atveju po raidžių bus rašoma:

  • n – respondentų skaičius;
  • p – patenkintų preke skaičius.

Šiuo atveju apklaustų moterų skaičius bus n1. Atitinkamai, vyrai – n2. Ta pati reikšmė turės skaičius „1“ ir „2“ prie simbolio p.

Testo rodiklio palyginimas su Studento skaičiavimo lentelių vidutinėmis reikšmėmis tampa vadinamuoju „statistiniu reikšmingumu“.

Ką reiškia patvirtinimas?

Bet kurio matematinio skaičiavimo rezultatus visada galima patikrinti, to vaikai mokomi net ir pradinė mokykla. Logiška manyti, kad kadangi statistiniai rodikliai nustatomi naudojant skaičiavimų grandinę, tada jie yra tikrinami.

Tačiau statistinio reikšmingumo tikrinimas nėra tik matematika. Statistika susijusi su daugybe kintamųjų ir įvairių tikimybių, kurias toli gražu ne visada galima apskaičiuoti. Tai yra, jei grįšime prie guminių batų pavyzdžio straipsnio pradžioje, tai logišką statistinių duomenų konstravimą, kuriais remsis prekių parduotuvėms pirkėjai, gali sujaukti rudeniui nebūdingi sausi ir karšti orai. . Dėl šio reiškinio sumažės guminius batus perkančių žmonių skaičius ir išparduotuvių patirs nuostolių. Žinoma, matematinė formulė negali numatyti oro anomalijos. Šis momentas vadinamas „klaida“.

Tikrinant apskaičiuoto reikšmingumo lygį atsižvelgiama būtent į tokių klaidų tikimybę. Jame atsižvelgiama tiek į apskaičiuotus rodiklius, tiek į priimtus reikšmingumo lygius, tiek į kiekius, paprastai vadinamus hipotezėmis.

Kas yra reikšmingumo lygis?

Sąvoka „lygis“ įtraukta į pagrindinius statistinio reikšmingumo kriterijus. Jis naudojamas taikomojoje ir praktinėje statistikoje. Tai yra tam tikras kiekis, kuriame atsižvelgiama į tikimybę galimi nukrypimai arba klaidų.

Lygis pagrįstas paruoštų mėginių skirtumų nustatymu, leidžia nustatyti jų reikšmingumą arba, atvirkščiai, atsitiktinumą. Ši sąvoka turi ne tik skaitmenines reikšmes, bet ir savitas jų interpretacijas. Jie paaiškina, kaip suprasti reikšmę, o pats lygis nustatomas lyginant rezultatą su vidutiniu indeksu, tai atskleidžia skirtumų patikimumo laipsnį.

Taigi, lygmens sąvoką galima pateikti paprastai – tai priimtinos, tikėtinos klaidos ar klaidos rodiklis išvadose, padarytose iš gautų statistinių duomenų.

Kokie reikšmingumo lygiai naudojami?

Klaidų tikimybės koeficientų statistinis reikšmingumas praktikoje grindžiamas trimis pagrindiniais lygiais.

Pirmasis lygis yra riba, kurią pasiekus vertė yra 5%. Tai yra, paklaidos tikimybė neviršija 5% reikšmingumo lygio. Tai reiškia, kad pasitikėjimas išvadų, padarytų remiantis statistinių tyrimų duomenimis, nepriekaištingumu ir neklystamumu siekia 95 proc.

Antrasis lygis yra 1% riba. Atitinkamai, šis skaičius reiškia, kad 99% patikimumu galima vadovautis duomenimis, gautais atliekant statistinius skaičiavimus.

Trečias lygis yra 0,1%. Su šia verte klaidos tikimybė yra lygi procento daliai, tai yra, klaidos praktiškai pašalinamos.

Kas yra statistikos hipotezė?

Klaidos kaip sąvoka yra suskirstytos į dvi sritis, susijusias su nulinės hipotezės priėmimu arba atmetimu. Hipotezė – tai sąvoka, už kurios pagal apibrėžimą slepiasi aibė kitų duomenų ar teiginių. Tai yra kažko, kas susiję su statistinės apskaitos dalyku, tikimybių pasiskirstymo aprašymas.

Paprastuose skaičiavimuose yra dvi hipotezės – nulinė ir alternatyvioji. Skirtumas tarp jų yra tas, kad nulinė hipotezė grindžiama idėja, kad tarp imčių, dalyvaujančių nustatant statistinį reikšmingumą, nėra esminių skirtumų, o alternatyvioji yra visiškai priešinga. Tai yra, alternatyvi hipotezė yra pagrįsta reikšmingu šių mėginių skirtumu.

Kokios yra klaidos?

Klaidos kaip statistikos sąvoka tiesiogiai priklauso nuo vienos ar kitos hipotezės pripažinimo teisinga. Jie gali būti suskirstyti į dvi kryptis arba tipus:

  • pirmasis tipas yra dėl to, kad buvo priimta nulinė hipotezė, kuri pasirodė esanti neteisinga;
  • antrasis atsiranda dėl alternatyvos laikymosi.

Pirmojo tipo klaidos vadinamos klaidingai teigiama ir yra gana paplitusios visose srityse, kuriose naudojama statistika. Atitinkamai, antrojo tipo klaida vadinama klaidingai neigiama.

Kodėl statistikoje svarbi regresija?

Regresijos statistinė reikšmė ta, kad pagal ją galima nustatyti, kiek duomenų pagrindu apskaičiuotas įvairių priklausomybių modelis atitinka tikrovę; leidžia nustatyti veiksnių pakankamumą ar trūkumą apskaitai ir išvadoms.

Regresijos reikšmė nustatoma lyginant rezultatus su Fisher lentelėse nurodytais duomenimis. Arba naudojant dispersijos analizę. Svarba regresijos rodikliai turi su kompleksu statistiniai tyrimai ir skaičiavimai, apimantys didelis skaičius kintamieji, atsitiktiniai duomenys ir tikėtini pokyčiai.

Panašūs straipsniai