Изследванията, проучванията на общественото мнение и проучванията разчитат на хората, които питат нещо, което се опитва да получи поведенчески модел или да предскаже резултат.

хора

Но колко хора трябва да поискате, за да откриете, че те имат някакво убедително значение?

Преди всеки избор винаги ще чувате някои политици, които поставят под въпрос анкетите, да казват: "Има само един глас, който има значение." регистрирани за гласуване.

Прочетете повече: Седем смъртоносни грехове на статистическа погрешна интерпретация и как да ги избегнете

Анкетите обаче са полезни, защото могат да предоставят бърз преглед на намеренията на хората.

Използването на малки проби от големи популации е валидна статистическа техника за получаване на точна информация за по-широка популация за част от времето и разходите.

Това е вярно навсякъде, където имаме големи или трудни за измерване популации.

Примерите включват контрол на качеството на производствената линия, броене на ягуари в Перу и дори проучване на читатели на разговори.

Колко голяма трябва да бъде пробата, за да бъдат нейните резултати надеждни? Зависи.

Марж на грешка

Всички извадкови оценки имат допустима грешка, която компенсира несъвършенствата на пробите спрямо популацията. Например, скорошното Newspoll даде на лейбъристите 2% преди коалицията въз основа на двустранни предпочитания.

Newspoll твърди, че 1728 души са участвали с максимална грешка при вземане на проби от ± 2,4%. Това означава, че най-голямата достоверна победа за лейбърите би била 4, 4% (2% плюс 2, 4% процент грешки), но е приемливо и това, че може да загуби 0, 4% (2% минус 2, 4%).

В това тясно растение бихме искали да намалим процента на грешките си, като увеличим размера на извадката. Но това ще бъде скъпо, тъй като печалбите в точността намаляват за по-големи числа. Ще бъде необходима извадка от приблизително 2400 души, за да се намали отклонението на грешката до ± 2%, а масова проба от 9 600, за да се намали до ± 1%.

Проблеми с качеството, както и с количеството

Оценките на изследванията и техните грешки са валидни само ако вземането на проби се извършва правилно. Ако извадката е изкривена, тогава по-големите размери на пробите вероятно ще ни дадат висока надеждност около неточна оценка.

Прочетете повече: Парадокси на вероятността и други статистически особености

Пробите от изследванията често са изкривени, защото се различават от популацията по важни начини. С 12,6 милиона респонденти еднополовото брачно проучване е добър пример през 2017 г., тъй като очевидно превъзхожда по-възрастните хора, които по-често се връщат към пощенското проучване.

За щастие, в този случай пристрастието не подкопава резултата, който беше гласуването за равенство в брака. Но оценка от 61, 6% в полза на равенството на брака, с малка грешка от 0, 03%, може да не отразява точно мнението на австралийското население.

Непредставителни проби също присъстват в клинични изпитвания, тъй като пациентите с висок риск често се изключват от изпитванията от съображения за безопасност.

Едно проучване установи, че 94% от хората с астма ще бъдат изключени от 17-те основни клинични изпитвания, използвани за разработване на насоки за лекарите за лечението на това състояние.

Това е сериозен проблем, тъй като лекарите трябва да дават съвети на всички свои пациенти, но най-добрите доказателства идват от проучвания, които са използвали обикновено по-здрави пациенти.

По същия начин, представете си, че се опитвате да предскажете как участниците в Netflix или Stan ще оценяват филми въз основа на оценки от други подобни абонати. Тези оценки вероятно ще бъдат изкривени, тъй като само хора, които харесват или не харесват филм, могат да го притесняват.

Това е важен въпрос, който трябва да бъде разгледан за разпространителите на онлайн съдържание, за да се предоставят на клиентите точни препоръки за филми.

Тъй като обществеността счита добра извадка?

Няма прости правила за преценка на правилния размер на извадката. По-големият обикновено е по-добър, но само ако проучването е направено добре.

Някои много големи извадки могат да използват евтини инструменти за събиране на данни, като Facebook, и следователно могат да бъдат силно изкривени. Малки проучвания само на 25 души могат да бъдат умни, особено там, където са положени усилия да се представи представителна извадка и да се преследват хора, които не реагират в началото.

Австралийският съвет по печата има насоки за докладване на анкети.

Къде бяха намерени участниците? Типични са интересите на цялото население?

Колко участници отказаха да отговорят? Ако само 10% от хората са отговорили, това вероятно е нетипична извадка, която изпитва силни чувства към предмета на изследването. (Помислете за кои анкети най-вероятно ще отговорите.)

Респондентите от проучването плащали ли са? Плащането ще увеличи процента на отговор, но може да повлияе и на отговорите на респондентите.

За съжаление тези данни често липсват в медийни доклади и новинарски доклади за вълнуващи констатации от проучвания, а често и в публикувани статии.

Респондентите от анкетата също могат да бъдат насочени към желаните отговори. Например в проучването на Nature сред 1576 изследователи относно кризата на възпроизводимост беше зададен въпросът:

Кое от следните твърдения за „кризата на възпроизводимост“ в рамките на научната общност е съгласно с кого се съгласявате?

и) Налице е значителна криза на възпроизводимостта

ii) Има лека криза на възпроизводимост

iii) Няма криза на възпроизводимост

(iv) Не знам.

Повечето (52%) хора отговориха за голяма криза „да“, 7% казаха „не знам“ и само 3% казаха „не“.

Прочетете повече: Регресия към средната стойност или защо съвършенството рядко трае

Това оставя въпроса какво се разбира под „лека криза“, присъдата на 38% от хората. Отговориха ли леко, защото са близо до категориите „не“ или „не знам“, или са близо до това, че го смятат за значителна криза? Не можем да кажем това.

Въпросът тук е да се даде на хората две опции „да“ и само една опция „не“. Изследването обаче беше - и все още е - докладвано като сериозно доказателство за криза в науката.

Като цяло, най-добре е да четете резултатите от всяко проучване със здравословен скептицизъм. Нашето проучване на двамата статистици, написали тази статия, показва 100% съгласие с това твърдение.