Statistikas nozīme: definīcija, jēdziens, nozīme, regresijas vienādojumi un hipotēžu pārbaude

Satura rādītājs:

Statistikas nozīme: definīcija, jēdziens, nozīme, regresijas vienādojumi un hipotēžu pārbaude
Statistikas nozīme: definīcija, jēdziens, nozīme, regresijas vienādojumi un hipotēžu pārbaude

Video: Statistikas nozīme: definīcija, jēdziens, nozīme, regresijas vienādojumi un hipotēžu pārbaude

Video: Statistikas nozīme: definīcija, jēdziens, nozīme, regresijas vienādojumi un hipotēžu pārbaude
Video: Atkārtojums par vienmērīgu taisnlīnijas kustību - mācību stunda (Mehānika, Fizika I → Fizika II) 2024, Aprīlis
Anonim

Statistika jau sen ir bijusi neatņemama dzīves sastāvdaļa. Cilvēki ar to saskaras visur. Pamatojoties uz statistiku, tiek izdarīti secinājumi par to, kur un kādas slimības ir izplatītas, kas ir vairāk pieprasīts konkrētajā reģionā vai noteiktā iedzīvotāju grupā. Pat valdības struktūru kandidātu politisko programmu veidošana balstās uz statistikas datiem. Tos izmanto arī mazumtirdzniecības ķēdes, iegādājoties preces, un ražotāji savos priekšlikumos vadās pēc šiem datiem.

Statistikai ir liela nozīme sabiedrības dzīvē un tā ietekmē katru tās individuālo locekli pat sīkumos. Piemēram, ja saskaņā ar statistiku lielākā daļa cilvēku konkrētajā pilsētā vai reģionā dod priekšroku tumšām krāsām drēbēs, tad vietējās tirdzniecības vietās atrast spilgti dzeltenu lietusmēteli ar ziedu apdruku būs ārkārtīgi sarežģīti. Bet kādos daudzumosvai šiem datiem ir šāda ietekme? Piemēram, kas ir “statistiski nozīmīgs”? Kas īsti ir domāts ar šo definīciju?

Kas tas ir?

Statistika kā zinātne sastāv no dažādu daudzumu un jēdzienu kombinācijas. Viens no tiem ir jēdziens "statistiskā nozīme". Šis ir mainīgo vērtību nosaukums, kurā citu rādītāju parādīšanās varbūtība ir niecīga.

Statistisko rādītāju aprēķins
Statistisko rādītāju aprēķins

Piemēram, 9 no 10 cilvēkiem pēc lietainas nakts rīta sēņošanas laikā rudens mežā uzvelk kājās gumijas apavus. Varbūtība, ka kādā brīdī 8 no viņiem uzvilka audekla mokasīnus, ir niecīga. Tādējādi šajā konkrētajā piemērā skaitlis 9 ir tas, ko sauc par “statistisko nozīmīgumu”.

Attiecīgi, ja tālāk attīstām doto praktisko piemēru, apavu veikali līdz vasaras sezonas beigām iepērk gumijas zābakus lielākā apjomā nekā citos gada laikos. Tādējādi statistiskās vērtības lielums ietekmē parasto dzīvi.

Protams, sarežģītos aprēķinos, teiksim, prognozējot vīrusu izplatību, tiek ņemts vērā liels skaits mainīgo. Bet pati statistikas datu nozīmīga rādītāja noteikšanas būtība ir līdzīga neatkarīgi no aprēķinu sarežģītības un mainīgo vērtību skaita.

Kā to aprēķina?

Izmanto, aprēķinot vienādojuma "statistiskās nozīmes" indikatora vērtību. Tas ir, var apgalvot, ka šajā gadījumā visu izšķir matemātika. Vienkāršākā aprēķina iespēja ir matemātisko darbību ķēde, kurā ir iesaistīti šādi parametri:

  • divu veidu rezultāti, kas iegūti no aptaujām vai objektīvu datu izpētes, piemēram, pirkumu summas, kas apzīmētas ar a un b;
  • izlases lieluma indikators abām grupām – n;
  • apvienotās izlases daļas vērtība - p;
  • standarta kļūda - SE.

Nākamais solis ir noteikt kopējo testa rezultātu - t, tā vērtība tiek salīdzināta ar skaitli 1,96. 1,96 ir vidējā vērtība, kas norāda 95% diapazonu saskaņā ar Stjudenta t sadalījuma funkciju.

Vienkārša aprēķina formula
Vienkārša aprēķina formula

Bieži rodas jautājums, kāda ir atšķirība starp n un p vērtībām. Šo niansi ir viegli noskaidrot ar piemēru. Pieņemsim, ka tiek aprēķināta vīriešu un sieviešu lojalitātes statistiskā nozīme jebkuram produktam vai zīmolam.

Šajā gadījumā burtiem sekos sekojošais:

  • n - respondentu skaits;
  • p - apmierināto ar preci skaits.

Šajā gadījumā intervēto sieviešu skaits tiks apzīmēts kā n1. Attiecīgi vīrieši - n2. Tai pašai vērtībai būs simbola cipari "1" un "2".

Pārbaudes rezultāta salīdzināšana ar Studenta izklājlapu vidējo rādītāju kļūst par tā saukto "statistisko nozīmīgumu".

Ko nozīmē verifikācija?

Jebkura matemātiskā aprēķina rezultātus vienmēr var pārbaudīt, to māca bērniem sākumskolā. Ir loģiski pieņemtka, tā kā statistika tiek noteikta, izmantojot aprēķinu ķēdi, tad tā tiek pārbaudīta.

Tomēr statistiskā nozīmīguma pārbaude nav tikai matemātika. Statistika attiecas uz lielu skaitu mainīgo lielumu un dažādām varbūtībām, kuras ne vienmēr var aprēķināt. Proti, ja atgriežamies pie gumijas apavu piemēra raksta sākumā, tad loģisko statistikas datu konstruēšanu, uz ko paļausiesies preču pircēji veikaliem, var izjaukt rudenim neraksturīgais sausais un karstais laiks.. Šīs parādības rezultātā samazināsies to cilvēku skaits, kuri iegādājas gumijas zābakus, un tirdzniecības vietas cietīs zaudējumus. Protams, matemātiskā formula nespēj paredzēt laikapstākļu anomāliju. Šo brīdi sauc par “kļūdu”.

Rīki statistikas datu vizualizācijai
Rīki statistikas datu vizualizācijai

Tā ir tikai šādu kļūdu iespējamība, un tiek ņemta vērā aprēķinātā nozīmīguma līmeņa pārbaude. Tajā tiek ņemti vērā gan aprēķinātie rādītāji, gan pieņemtie nozīmīguma līmeņi, kā arī daudzumi, ko parasti sauc par hipotēzēm.

Kāds ir nozīmes līmenis?

Jēdziens "līmenis" ir iekļauts galvenajos statistiskās nozīmīguma kritērijos. To izmanto lietišķajā un praktiskajā statistikā. Šī ir sava veida vērtība, kas ņem vērā iespējamo noviržu vai kļūdu iespējamību.

Līmenis ir balstīts uz gatavu paraugu atšķirību identificēšanu, tas ļauj noteikt to nozīmīgumu vai, gluži pretēji, nejaušību. Šim jēdzienam ir ne tikai digitālas nozīmes, bet arī to savdabīgās interpretācijas. Viņi paskaidrokā jums ir jāsaprot vērtība, un pats līmenis tiek noteikts, salīdzinot rezultātu ar vidējo indeksu, tas atklāj atšķirību ticamības pakāpi.

Diskusija par statistiku
Diskusija par statistiku

Tādējādi līmeņa jēdzienu varam iedomāties vienkārši - tas ir pieņemamas, iespējamas kļūdas vai kļūdas rādītājs secinājumos, kas izdarīti no iegūtajiem statistikas datiem.

Kādi nozīmīguma līmeņi tiek izmantoti?

Kļūdu varbūtības koeficientu statistiskā nozīmība praksē balstās uz trim pamatlīmeņiem.

Pirmais līmenis ir slieksnis, pie kura vērtība ir 5%. Tas ir, kļūdas iespējamība nepārsniedz 5% nozīmīguma līmeni. Tas nozīmē, ka pārliecība par to secinājumu nevainojamību un nekļūdīgumu, kas izdarīti, pamatojoties uz statistikas pētījumu datiem, ir 95%.

Otrais līmenis ir 1% slieksnis. Attiecīgi šis skaitlis nozīmē, ka ar 99% ticamību var vadīties pēc statistikas aprēķinos iegūtajiem datiem.

Trešais līmenis - 0,1%. Izmantojot šo vērtību, kļūdas iespējamība ir vienāda ar daļu no procentiem, tas ir, kļūdas praktiski tiek novērstas.

Kas ir hipotēze statistikā?

Kļūdas kā jēdziens ir sadalītas divās jomās, kas attiecas uz nulles hipotēzes pieņemšanu vai noraidīšanu. Hipotēze ir jēdziens, aiz kura saskaņā ar definīciju slēpjas aptaujas rezultātu kopums, citi dati vai apgalvojumi. Tas ir, ar statistiskās uzskaites priekšmetu saistīta varbūtības sadalījuma apraksts.

regresijas statistiskā nozīmība
regresijas statistiskā nozīmība

Vienkāršos aprēķinos ir divas hipotēzes - nulle un alternatīva. Atšķirība starp tām ir tāda, ka nulles hipotēze balstās uz domu, ka starp statistiskā nozīmīguma noteikšanā iesaistītajiem paraugiem nav būtisku atšķirību, un alternatīvā ir tai pilnīgi pretēja. Tas nozīmē, ka alternatīvā hipotēze ir balstīta uz būtisku atšķirību esamību šajos paraugos.

Kādas ir kļūdas?

Kļūdas kā jēdziens statistikā ir tieši proporcionāli šīs vai citas hipotēzes pieņemšanai par patiesu. Tos var iedalīt divos virzienos vai veidos:

  • pirmais veids ir saistīts ar nulles hipotēzes pieņemšanu, kas izrādījās nepareiza;
  • sekunde - izraisīja alternatīvas ievērošana.
Statistikas grafiku apskate
Statistikas grafiku apskate

Pirmais kļūdu veids tiek saukts par viltus pozitīvu, un tas ir diezgan izplatīts visās jomās, kur tiek izmantota statistika. Attiecīgi otrā veida kļūdu sauc par viltus negatīvu.

Kāpēc mums ir vajadzīga regresija statistikā?

Regresijas statistiskā nozīme ir tāda, ka ar tās palīdzību var konstatēt, cik uz datu bāzes aprēķinātais dažādu atkarību modelis atbilst realitātei; ļauj identificēt faktoru pietiekamību vai trūkumu uzskaitei un secinājumiem.

Regresijas vērtību nosaka, salīdzinot rezultātus ar Fišera tabulās norādītajiem datiem. Vai arī izmantojot dispersijas analīzi. Regresijas rādītāji ir svarīgi, kadsarežģīti statistikas pētījumi un aprēķini, kas ietver lielu skaitu mainīgo lielumu, nejaušus datus un iespējamās izmaiņas.

Ieteicams: