To, co naukowcy nie pomykają się na temat dowodów statystycznych i jak to naprawić

- Nauka - 19 lutego, 2025
To, co naukowcy nie pomykają się na temat dowodów statystycznych i jak to naprawić
The Concept of Statistical Evidence Historical Roots and Current Developments.jpg
To, co naukowcy nie pomykają się na temat dowodów statystycznych i jak to naprawić

Statystyka jest kluczowym narzędziem w nauce, pomagając nam zrozumieć, co dane ujawniają na temat ważnych pytań. Jednak idea „dowodów statystycznych” pozostaje trudna do zdefiniowania. Profesor Michael Evans z University of Toronto bada ten złożony problem w swoim ostatnim badaniu, opublikowanym w Encyclopedia 2024.

W dziedzinie statystyki dotyczy sytuacji, w których istnieje ilość zainteresowania, której wartość jest nieznana, dane zostały zebrane i uważa się, że dane te zawierają dowody dotyczące nieznanej wartości. Istnieją zatem dwa główne problemy, na które teoria statystyczna ma odpowiedzieć na podstawie danych: (i) zapewnić rozsądną wartość dla ilości zainteresowania wraz z miarą dokładności oszacowania, oraz (ii) ocenić, czy istnieją dowody w dowodach w przychylność lub przeciw hipotetycznej wartości dla ilości zainteresowania wraz z miarą siły dowodów. Na przykład oszacowanie odsetka osób zakażonych COVID-19, które będą miały poważną chorobę, jest z pewnością interesująca lub, w oparciu o pomiary podjęte przez teleskop Webb, pożądane jest, aby wiedzieć, czy dowody na hipotetyczne istnienie ciemnej strony ciemnej materia została uzyskana.

Jak omawia artykuł, istnieją dwa szerokie tematy dotyczące rozwiązania tych problemów: podejście dowodowe i decyzje. Podejście dowodowe koncentruje się na zapewnieniu, że każda zastosowana metodologia statystyczna opiera się wyraźnie na dowodach w danych. Natomiast teoria decyzji ma na celu stosowanie metodologii, które minimalizują potencjalne straty w oparciu o założoną miarę kar za nieprawidłowe wnioski. W przypadku zastosowań naukowych argumentuje się jednak, że ustalanie priorytetów dowodów w danych wygodnie pasuje do fundamentalnego celu nauki, a mianowicie ustalania prawdy. Artykuł profesora Evansa mocno umieszcza go w obozie dowodowym.

Poniższy cytat z artykułu określa podstawowy problem dla podejścia dowodowego: „Większość analiz statystycznych odnosi się do koncepcji dowodów statystycznych, jak w wyrażeniach takich jak„ dowody w danych sugerujących ”lub„ na podstawie końcowych dowodów ”itp. Od dawna uznano jednak, że sama koncepcja nigdy nie została zadowalająco zdefiniowana lub przynajmniej nie oferowano żadnej definicji, która spotkała się z ogólnym zatwierdzeniem. ”

Podstawową kwestią dla podejścia dowodowego jest: w jaki sposób należy zdefiniować dowody statystyczne? Bo bez jasnej recepty na to, co oznaczają dowody statystyczne, jak można twierdzić, że określona metodologia jest oparta na dowodach? Artykuł profesora Evansa dokonuje przeglądu wielu podejść podjętych na przestrzeni lat, aby odpowiedzieć na to pytanie.

Istnieją kilka znanych metod statystycznych, które są wykorzystywane jako wyrażenia dowodów statystycznych. Wielu zna stosowanie wartości p dla problemu (II). Istnieją dobrze znane problemy z wartościami p jako miarami dowodów statystycznych, a niektóre z nich są przejrzane w artykule. Na przykład istnieje potrzeba wyboru alfa odcięcia w celu ustalenia, kiedy wartość p jest wystarczająco mała, aby powiedzieć, że istnieją dowody przeciwko hipotezie i nie ma naturalnego wyboru dla alfa. Ponadto wartości p nigdy nie dostarczają dowodów na korzyść hipotezy jest prawdziwa. Pojęcie przedziału ufności jest silnie związane z wartością p, a zatem cierpi na podobne wady.

Jedną z istotnych prób ustalenia pojęcia dowodów statystycznych jako centralnego w dziedzinie statystyki została podjęta w latach 60. i 70. przez Allana Birnabuma, a jego praca omówiono w artykule. Spowodowało to odkrycie szeregu interesujących relacji między zasadami, które wielu statystyk subskrybuje, takie jak zasady prawdopodobieństwa, wystarczalności i warunkowości. Birnbaum nie udało się w pełni scharakteryzować, co rozumieją dowody statystyczne, ale jego praca wskazuje na kolejny znany podział w dziedzinie statystyki: częstotliwość kontra bayesianizm. Birnbaum szukał definicji dowodów statystycznych w ramach częstotliwości. Wartość P i przedział ufności mają charakter częstotliwy. Często wyobraża sobie, że problem statystyczny, który badany jest powtarzany wiele niezależnych czasów, a następnie szuka procedur statystycznych, które będą dobrze działać w takiej sekwencji.

Natomiast Bayesian chce, aby wnioskowanie zależało wyłącznie od zaobserwowanych danych i nie uważa tak wyobrażonej sekwencji. Kosztem podejścia bayesowskiego jest potrzeba zapewnienia analityka wcześniejszego rozkładu prawdopodobieństwa ilości zainteresowania, która odzwierciedla to, w co analityk wierzy o prawdziwej wartości tej ilości. Po obejrzeniu danych bayesowski statystyk jest zmuszony do aktualizacji swoich przekonań, wyrażony przez tylny rozkład prawdopodobieństwa ilości zainteresowania. Porównanie wcześniejszych i tylnych przekonań prowadzi do jasnej definicji dowodów statystycznych poprzez intuicyjne zasada dowodów: Jeżeli prawdopodobieństwo tylnego tego, że konkretna wartość jest prawdziwa, jest większe, odpowiadające wcześniejsze prawdopodobieństwo, istnieją dowody, że jest to prawdziwa wartość i jeśli prawdopodobieństwo tylne jest mniejsze niż wcześniejsze prawdopodobieństwo, wówczas istnieją dowody na to, że jest to prawdziwa wartość . Dane w danych zmieniają przekonania, a zasada dowodów charakteryzuje to wyraźnie.

Jak wyjaśniono w artykule profesora Evansa, wymagane są dodatkowe elementy wykraczające poza zasadę dowodów. Oszacowanie i zmierzenie siły dowodów, konieczne jest zamówienie możliwych wartości ilości zainteresowania, a naturalnym sposobem na to jest względne wskaźnik przekonań: stosunek prawdopodobieństwa tylnego wartości do jej wcześniejszego prawdopodobieństwo. Gdy ten współczynnik jest większy niż 1, wówczas istnieją dowody na korzyść, a im większe jest to, tym więcej dowodów na korzyść i odwrotnie, gdy stosunek jest mniejszy niż 1. Współczynnik przekonania względnego prowadzi do naturalnych odpowiedzi na zarówno oszacowanie oraz problemy z oceną hipotez.

W artykule jest znacznie bardziej omawiane, w tym, w jaki sposób radzimy sobie z nieodłączną podmiotowością metodologii statystycznej, jak w przypadku stosowania sprawdzania modelu i sprawdzania konfliktu wcześniejszego. Być może jednak najbardziej zaskakujące jest to, że podejście dowodowe poprzez względne przekonanie prowadzi do rozwiązywania częstotliwości i bayesianizmu. Częścią historii jest to, że wiarygodność jakiegokolwiek wnioskowania należy zawsze oceniać i to właśnie robi częstotliwość. Powstaje to w podejściu do przekonania względnego poprzez kontrolowanie wcześniejszych prawdopodobieństw uzyskania dowodów na wartość, gdy jest to prawdą, i uzyskanie dowodów na korzyść wartości, gdy jest to fałszywe. Ostatecznie wnioskowanie jest bayesowskie, ponieważ odzwierciedla przekonania i zawiera jasną definicję dowodów statystycznych, podczas gdy kontrolowanie wiarygodności wnioskowania jest częste. Oba odgrywają kluczową rolę w stosowaniu statystyk do problemów naukowych.

Ponieważ świat staje się bardziej zależny od spostrzeżeń opartych na danych, zrozumienie tego, co kwalifikuje się jako solidne dowody, jest coraz ważniejsze. Badania profesora Evansa oferują przemyślane podstawy do rozwiązania tego palącego problemu.

Referencje dziennika

Evans, M. „Pojęcie dowodów statystycznych, korzeni historycznych i obecnych osiągnięć”. Encyklopedia 2024, 4, 1201–1216. Doi: https://doi.org/10.3390/encyclopedia4030078

O autorze

Michael Evans jest profesorem statystyki na University of Toronto. Otrzymał doktorat. z University of Toronto w 1977 r. I jest tam zatrudniony z liśćmi spędzonymi na Uniwersytecie Stanforda i Carnegie Mellon University. Jest członkiem American Statistics Association, pełnił funkcję przewodniczącego Departamentu Statystyki 1992-97, tymczasowego przewodniczącego 2022-23 oraz prezesem Statystycznego Towarzystwa Kanady 2013-2014. Służył w wielu zdolnościach redakcyjnych: redaktor naczelny JASA Theory and Methods 1991-2005, redaktor naczelny Canadian Journal of Statistics 1999-2006 i 2017, redaktor Journal Bayesian Analysis 2005-2015 i jako An Redaktor 2015-2021, redaktor przedmiotowy dla czasopisma online (obecny) i redaktor naczelny New England Journal of Statistics in Data Science (aktualny).
Badania Michaela Evansa dotyczyły wielowymiarowej metodologii statystycznej, statystyki obliczeniowej i podstaw statystyki. Obecnym celem badań jest rozwój teorii wnioskowania zwanego przekonaniem względnym, opartym na wyraźnej definicji sposobu mierzenia dowodów statystycznych. Ponadto jego badania dotyczą rozwoju narzędzi do radzenia sobie z krytyką metodologii statystycznej związanej z jej nieodłączną podmiotowością. Autor lub współautor, wiele artykułów badawczych, a także książki przybliżające całki za pośrednictwem Monte Carlo i metod deterministycznych (z T. Swartz) opublikowanym przez Oxford w 2000 r., Prawdopodobieństwo i statystyki: The Science of Upeewności (z J. Rosenthal ) Opublikowane przez WH Freeman w 2004 i 2010 r. I mierząc dowody statystyczne z wykorzystaniem względnych przekonań opublikowanych przez CRC Press/ Chapman i Hall w 2015 r.

źródło

0 0 głosów
Article Rating
Subskrybuj
Powiadom o
guest
0 komentarzy
najstarszy
najnowszy oceniany
Inline Feedbacks
Wszystkie
Follow by Email
LinkedIn
Share
Copy link
Adres URL został pomyślnie skopiowany!
0
Would love your thoughts, please comment.x