Понеділок, 27 вересня 2021

Актуальне

Відсутність новин - теж хороша новина

Статистичні трюки, які збивають нас з пантелику

Якщо ви не хочете бути обдуреними розрекламованими дослідженнями, доведеться розібратися в якихось статистичних трюках, які можуть збити вас з пантелику

"Деякі дослідження показують, що сексуальність людини можна визначити за довжиною пальців". Такий заголовок з 'явився нещодавно в провідному науковому виданні в галузі сексуальності "Архіви сексуальної поведінки". Заснований такий висновок на дослідженні, рецензованому шановними вченими в Університеті Ессекса. Особисто мені здається, що це купа нісенітниці і не більше ніж статистичні трюки.

Просто, коли починає здаватися, що читачі новин можуть схаменутися і почати цікавитися, чи проводилося рецензування дослідження, чи була вибірка досить широкою або хто фінансував цю роботу, на допомогу приходить головний козир. У цьому випадку обман приймає форму довірчих інтервалів - статистичне поняття, в якому непрофесіонал ніколи не розбереться, щоб дійсно правильно зрозуміти новинну статтю.

Але, якщо ви не хочете бути обдуреними розрекламованими і марними дослідженнями, доведеться все-таки розібратися в декількох статистичних принципах, які можуть збити вас з пантелику, навіть коли проставлені всі галочки "законного дослідження".

Чим я ризикую спочатку?

Один з найбільш гнітючих заголовків, які я коли-небудь читала, звучав так: "Восьмирічне дослідження показало, що любителі картоплі фрі подвоюють ризик своєї смерті". "Уф, - сказала я вголос, потягуючи червоне вино і дивлячись на великий кошик старої доброї золотистої картоплі, що стоїть переді мною.


Так, згідно з рецензованим дослідженням, опублікованим в "Американському журналі клінічного харчування", це правда. Вживання картоплі фрі дійсно подвоює ризик смерті. Але, як багато для цього треба з 'їсти? І який спочатку у мене ризик смерті?

У дослідженні стверджується, що, якщо ви їсте картоплю фрі тричі на тиждень або частіше, то подвоюєте свій ризик смерті. Розглянемо звичайну людину в рамках цього дослідження: наприклад, 60-річного чоловіка. Який у нього ризик смерті, незалежно від того, скільки картоплі фрі він їсть? Один відсоток. Це означає, що якщо взяти 100 60-річних чоловіків, то хоча б один з них помре протягом наступного року просто тому, що йому вже 60 років.

Отже, якщо всі ці 100 чоловіків їдять картоплю фрі не менше трьох разів на тиждень все своє життя, то так, їх ризик смерті подвоюється. Але подвоєний один відсоток - це лише два відсотки. Замість одного з них, за рік помре два. І вони їдять картоплю фрі тричі на тиждень все життя - звучить, як дуже привабливий ризик.

Така статистична концепція називається відносний ризик. Якщо шанс отримати якесь захворювання - один з мільярда, то навіть якщо ви його врахуєте, це буде всього лише чотири з мільярда. Швидше за все, цього не станеться.

Тому, наступного разу, коли ви побачите збільшення або зменшення ризику, перше питання, яке ви повинні поставити - збільшення або зменшення від якого початкового ризику?

Крім того, чи могли ці люди, як і я, насолоджуватися келихом вина або пінтою пива разом з картоплею фрі? Чи могло щось ще вплинути на результат?

Є сир перед сном означає померти, заплутавшись у простирадлах?

У деяких країнах дитяча коробка стала модним подарунком від держави новоспеченим батькам. Такий подарунок покликаний забезпечити новонароджених безпечним місцем для сну. Ініціатива пішла від фінів, наприкінці 30-х років ХХ століття вони робили великі зусилля для зниження дитячої смертності уві сні. У картонній коробці поміщалися речі першої необхідності: кілька пелюнок, дитячі серветки, боді, слинявчики та інше.


З появою дитячої коробки рівень дитячої смертності у Фінляндії різко знизився, зараз в країні один з найнижчих рівнів дитячої смертності в світі. Цей факт змушує думати, що саме дитячі коробки стали причиною зниження рівня дитячої смертності.

Але вгадайте, що ще змінилося? Ведення вагітності. Щоб отримати право на дитячу коробку, жінка повинна була регулярно спостерігатися в медичних установах з перших чотирьох місяців вагітності.

У 1944 році 31% фінських матерів отримували дородове виховання. У 1945 році цей показник злетів до 86%. Не дитяча коробка була причиною зміни рівня дитячої смертності, а дородове виховання і контроль здоров 'я.

Це класичний випадок, коли кореляція не те ж саме, що причинний зв 'язок. Введення дитячих коробок і зниження рівня дитячої смертності пов 'язані, але одне не випливає безпосередньо з іншого.

Однак цей невеликий факт не завадив виробникам дитячих коробок продавати направо і наліво "Оригінальні дитячі коробки прямо з Фінляндії" за 449 доларів і 99 центів. А тим часом США виділяють кошти з бюджету на такі коробки для нових матерів.

Тому, наступного разу, коли ви побачите взаємозв 'язок на зразок того, що "вживання сиру перед сном загрожує смертю в сплутаних простирадлах", задайтеся питанням: "А що ще могло стати причиною?"

Коли похибка більша, ніж ефект

Останні дані Бюро трудової статистики в США показали, що рівень безробіття в країні знизився з 3,9% в серпні до 3,7% у вересні. При з 'ясуванні цих цифр, співробітники бюро явно не опитували кожного жителя США про наявність у нього роботи. Вони опитали невелику вибірку людей, а потім узагальнили результати.

Це означає, що офіційний рівень безробіття в будь-який заданий момент - це всього лише припущення. Ця "помилка плюс-мінус" визначається тим, що статистика називає довірчим інтервалом.


Насправді дані говорять, що кількість безробітних в країні зменшилася на 270 000, але з можливою похибкою, з довірчим інтервалом в 263 000. Простіше озвучити одне число, наприклад, 270 000. Але вибірка завжди матиме похибку, і правильніше сприймати це число як діапазон. У такому разі статистика стверджує, що кількість безробітних скоротилася десь у діапазоні від 7 000 до 533 000.

Те ж саме і з визначенням сексуальності за довжиною пальців - можлива похибка може просто звести нанівець всі результати дослідження.

Найочевидніший приклад довірчих інтервалів, що заплутують нас, - це опитування перед виборами. Робиться вибірка з населення, з 'ясовується, за кого будуть голосувати в цій вибірці, і з цього робиться висновок, як поведе себе населення в день виборів.

Тому, наступного разу, коли ви побачите число, що говорить про все населення при відсутності можливості опитати кожну окрему людину або перевірити кожен окремий предмет, задайтеся питанням про похибку.

Чи гарантує знання цих трьох статистичних аспектів, що вас ніколи не обдурять? Ні. Але це, без сумніву, вам знадобиться.

Найпопулярніше на сайті