Статистика - основни понятия
Какво представляват променливите. Променливите или по друг начин статистически знаци, вектори, са неща, които измерваме, наблюдаваме или манипулираме по време на изследването. Те се различават по ролята, която играят в нашето изследване, и по начина, по който са измерими.
Какво население. Популация, иначе основен набор, е съвкупност от всички възможни елементи, респонденти, подходящи за феномена, който ни интересува. Например всички избиратели на президентските избори. Или всички хора с левкемия, ако търсим лек за това заболяване. Или всички те са възможни полета, ако обектът е изследване на почвата.
Какво е проба. Проба или селекция, или по друг начин данни, набор от данни, е подмножество от цялата популация. Изследователят анализира пробата и се опитва да обобщи резултатите, открити върху нея, за цялата популация. Във файл с данни един респондент представлява един ред, а променливите представляват колони. Следователно това е матрица, която има толкова редове, колкото са респондентите в извадката, и толкова колони, колкото са наблюдаваните променливи. Чрез обединяването на всички възможни извадки получаваме цялата популация.
Корелация и експериментални изследвания. При изследване на корелацията ние изследваме връзките между променливите, макар и да не засягаме променливите, ние само ги измерваме и търсим връзки, напр. каква е връзката между времето, постигнато при преминаване на 100-метров басейн и броя изстрели. При експериментални изследвания ние манипулираме някои променливи и след това измерваме ефекта от тази манипулация върху други променливи. Например, ние обучаваме респондентите да плуват известно време и след това измерваме гореспоменатата зависимост. Само експерименталните изследвания ще ни дадат пълни доказателства за причинно-следствена връзка. При експериментални изследвания имаме възможността да разберем, че промяната в променливата A е причинила промяната в променливата B. Докато изследването на корелацията говори само за зависимост, но не предоставя убедителни доказателства за причината.
Връзки между променливи. Променливите, независимо от техния тип, са във връзка, с други думи, има връзка между тях, пристрастяване, ако техните стойности в извадката на респондентите системно съответстват една на друга. Например, нека вземем извадка от респонденти, за които измерваме ръст и тегло. Като правило, по-високото има тенденция да бъде по-тежко, така че можем да очакваме тези две променливи да бъдат във връзка, с други думи - независими.
Две основни характеристики на всяка връзка между променливите. Те са размер и надеждност, тоест надеждност.
Размерът на сесията в извадката е лесно измерим. Например размерът на връзката между затлъстяването и нивата на холестерола в кръвта е висок. Поне на конкретна извадка от изследването можем да предскажем, че първото е причината за второто.
Надеждността е по-малко интуитивна от размера, но е много важна. Той говори за представителността на резултата, получен от конкретна извадка. Това говори за вероятността, че ако подберем други респонденти от същата популация, можем да очакваме подобен резултат като за оригиналната извадка. Като правило изследователят трябва да обобщи резултата, получен от извадката, за цялата популация. Надеждността може да бъде количествено оценена и в следващия текст ще я срещнем като р-стойност или ниво на значимост.
Какво е нивото на значимост (р-стойност). Нивото на значимост на получения резултат от пробата е вероятността наблюдаваната зависимост, респ. разликата между променливите в извадката на респондентите е чисто случайна и тази в цялата популация, от която е избрана извадката, тази зависимост, респ. няма разлика. Колкото по-високо е нивото на значимост, толкова по-малко може да се очаква наблюдаваната зависимост, получена от изследователската извадка от респонденти, за цялата популация.
Например, ниво на значимост от 0,05 показва, че няма повече от 5% вероятност връзката между променливите, намерени в извадката, да е чисто произволна. С други думи, р-стойността е вероятността за грешка, причинена от приемането на резултата от зависимостта, получена от извадката, като валидна за цялата популация. Следователно, ако приемем, че няма такава връзка в популацията, тогава при р-стойност 0,05 за всеки 20 повторения на експеримента, тази връзка може да се появи в една извадка. Но ако наистина има такава връзка в популацията, тогава вероятността този факт да бъде потвърден при повторение на експеримента се нарича сила на теста и внимавайте, не е 1-p.
За една наистина значителна зависимост, респ. разлика, такъв резултат се счита, ако р-стойността е по-малка от 0,05. В някои изследователски задачи се използва по-строг критерий, стр
Степен на зависимост и нейната интерпретация. Целта на статистическото тестване е да се изчисли връзката между променливите, т.е. съотношението на обяснената вариация на една променлива от другата към общата вариация на тази променлива. По този начин, доколкото, изразено като процент, промяната в първата променлива може да се обясни с промяната във втората и обратно.
Ефект от неспазване на презумпцията за нормалност. Повечето от горните твърдения са математически доказани, но някои от тях се основават само емпирично, чрез така наречените експерименти на Монте-Карло. По този начин беше определена степента, до която тестовете, базирани на нормалността, са чувствителни към неспазване на предположението за нормално разпределение. Заключението на тези проучвания беше, че последицата от това неспазване е по-малко сериозна, отколкото се смяташе първоначално. Следователно използването на тестове за разделяне във всички видове изследвания в момента нараства популярността.
Преведени части от:
StatSoft, Inc. (1999). Електронен учебник по статистика. Талса, ОК: StatSoft. УЕБ: http://www.statsoft.com/textbook/stathome.html
- Статистиката, която буквално замразява до 380 милиона деца по света, няма какво да каже!
- Традиционна китайска медицина, понятия в традиционната китайска медицина,
- Тиймбилдинг Ponteo Ponteo Activity Park Rusovce
- В apidomeček в Prievidza 60 000 пчели ще ви лекуват
- Тъмно кафява ушна кал, здраве - дискусия