艤装してます

しばらくかかりそ。サグラダファミリアより遅くなるかも。

「 ’ 統計的に有意差なし ’ もうやめませんか」Nature に科学者800人超が署名して投稿

確信犯(誤義)なので、何を言っても無駄なんでしょうが。
でじたる でじたる庁利権に支那中共筒抜けの TikTok 使ってみたり、まいなんばー利権に鮮人半島筒抜けの LINE つないでみたり。

 

クリックで表示

 なぜなら、仮説検定では「帰無(きむ)仮説」と「対立仮説」という概念を用いるからだ。  帰無仮説はとりあえず立てた仮説(多くは検定者が否定したい仮説)であり、帰無仮説が間違っていると確信できる(棄却できる)ときに選ばれるのが対立仮説だ。  薬効の例での帰無仮説は「2群のパラメータは同じ」になる。これを検定手順を踏み棄却することで、「薬を与えた群のパラメータの方が対照群より大きい」という対立仮説を採択できる。  帰無仮説を棄却するかどうかの基準が有意水準だ。帰無仮説の基で計算したある検定統計量がその値となる確率(P値)が、有意水準(多くは5%)を下回れば、帰無仮説は棄却できる。つまり、「2群のパラメータは同じ」という仮説は誤りだと判断されるので、「薬を与えた群のパラメータの方が有意に大きい(薬効がある)」といえる。  問題はP値が有意水準より大きい場合だ。この場合、帰無仮説を棄却できないが、帰無仮説が正しいことも示していない。結果、「2群に有意差があるとはいえない」というあいまいな表現になる。

クリックで表示

 なぜなら、仮説検定では「帰無(きむ)仮説」と「対立仮説」という概念を用いるからだ。  帰無仮説はとりあえず立てた仮説(多くは検定者が否定したい仮説)であり、帰無仮説が間違っていると確信できる(棄却できる)ときに選ばれるのが対立仮説だ。  薬効の例での帰無仮説は「2群のパラメータは同じ」になる。これを検定手順を踏み棄却することで、「薬を与えた群のパラメータの方が対照群より大きい」という対立仮説を採択できる。  帰無仮説を棄却するかどうかの基準が有意水準だ。帰無仮説の基で計算したある検定統計量がその値となる確率(P値)が、有意水準(多くは5%)を下回れば、帰無仮説は棄却できる。つまり、「2群のパラメータは同じ」という仮説は誤りだと判断されるので、「薬を与えた群のパラメータの方が有意に大きい(薬効がある)」といえる。  問題はP値が有意水準より大きい場合だ。この場合、帰無仮説を棄却できないが、帰無仮説が正しいことも示していない。結果、「2群に有意差があるとはいえない」というあいまいな表現になる。  しかし、声明では「有意差がない=効果がない」と間違った推論をする論文も少なくないと指摘。実際に調べたところ、5つの論文誌・791文献のうち51%に誤りがみられたという。  このような統計の誤用を続けると、実際にはデータの平均は同じなのに、異なる論文間で片方は効果があり(=有意差があり)、片方は効果がない(有意差がないことの誤解)という矛盾が発生してしまうこともあるとしている。

クリックで表示

 声明では「(あるないの二分法ではなく)統計の不確実性を受け入れる必要がある」とした上で、「(統計的有意差ではなく)信頼区間を使うべきだ」と指摘。さらに、「信頼区間」という単語も「互換区間」(compatibility intervals)に言い換え、計算結果への過剰な信頼を避けるようにすべきだとしている。 ※信頼区間区間推定において、ある確率(信頼係数)のもとで母数がその内に含まれると推定された区間のこと(統計WEBより)  「統計的有意性の誤用は、科学コミュニティーや科学的なアドバイスを頼る人たちに大きな損害を与えた。P値や信頼区間、その他統計的尺度はそれぞれ存在意義があるが、“統計的有意性”を使うのはもうやめるときだ」(声明) Copyright © ITmedia, Inc. All Rights Reserved.

 

f:id:tu_ray_0g_0s1:20211124202215p:plain

順序を変えて貼付。

(略) 「猫は人間の話を理解できない」という仮説を立てたとしよう。これに対して、「猫は人間の話を理解できる」という帰無仮説を立てる。実験結果をもとに、ある有意水準で、帰無仮説が棄却されない場合、猫は人間の話を理解できるということが、誤っているとは言えない、と示されたことになる。しかし、だからといって、猫は人間の話を理解できる、と示された訳ではない。

toyokeizai.net

「『誤っているとは言えない、と判断された』というのは、曖昧でやりきれない。せっかく、統計的検定を行ったのに、正誤の判定ができなかったというのは気が引ける。ここは、少し強引にでも、結論を導いてしまおう。棄却されないということは、帰無仮説が正しいということではないか。それならば、『帰無仮説は正しい、と判断された』と述べてしまっていいだろう。」 統計学を用いて、結論を導き出したい、と考える人は、こんな風に考えてしまいがちだ。(略)
 
このように、統計的検定は、帰無仮説が棄却されないときに、結論が冗長となりやすい。そして、結論をわかりやすくしようとして、ついつい短縮してしまいがちになる。短縮された結論は、聞き心地がよく、誤ったまま、理解されてしまいやすい。統計的検定で、得られた結論が、妙にわかりやすいときには、その結論が短縮されていないかどうか、疑ってみるべきと思われるが、いかがだろうか。

 

f:id:tu_ray_0g_0s1:20211124202215p:plain
順序を戻して貼付。

(略) (統計的検定の)方法は、数学でよく見かける「背理法」に似ている。背理法は、次のような証明法だ。
「Aであることを、証明しようとする。そのために、まず、Aでないことを仮定する。次に、その仮定に従って、論理を進めていき、矛盾を導き出す。そして、この矛盾は、Aでないとの仮定が誤っていたために生じたものだと、帰結する。こうして、Aであることが、証明された、との結論に至る。」
 
統計的推論では、この背理法に、確率が加わるために、表現がややこしくなる。先ほどの5%のような一定の水準を、「有意水準」と呼ぶ。そして、帰無仮説に基づいて計算した確率が、有意水準よりも小さい場合に、帰無仮説は誤っていると判定する。このことを、
有意水準5%で、帰無仮説は棄却され、誤っている、と判断された。」
などと、主張することになる。
 
ややこしいのが、帰無仮説に基づいて計算した確率が、有意水準以上であった場合だ。この場合は、帰無仮説は棄却されない。しかし、棄却されないからといって、帰無仮説が正しいと示された訳ではない。帰無仮説は誤っているとも、正しいとも、示されなかったことになる。この場合、
有意水準5%では、帰無仮説は棄却されず、誤っているとは言えない、と判断された。」
との結論となる。
 
「『誤っているとは言えない、と判断された』というのは、曖昧でやりきれない。せっかく、統計的検定を行ったのに、正誤の判定ができなかったというのは気が引ける。ここは、少し強引にでも、結論を導いてしまおう。棄却されないということは、帰無仮説が正しいということではないか。それならば、『帰無仮説は正しい、と判断された』と述べてしまっていいだろう。」 統計学を用いて、結論を導き出したい、と考える人は、こんな風に考えてしまいがちだ。次のような、具体例を見てみよう。

 

toyokeizai.net

「猫は人間の話を理解できない」という仮説を立てたとしよう。これに対して、「猫は人間の話を理解できる」という帰無仮説を立てる。実験結果をもとに、ある有意水準で、帰無仮説が棄却されない場合、猫は人間の話を理解できるということが、誤っているとは言えない、と示されたことになる。しかし、だからといって、猫は人間の話を理解できる、と示された訳ではない。
 
このように、統計的検定は、帰無仮説が棄却されないときに、結論が冗長となりやすい。そして、結論をわかりやすくしようとして、ついつい短縮してしまいがちになる。短縮された結論は、聞き心地がよく、誤ったまま、理解されてしまいやすい。統計的検定で、得られた結論が、妙にわかりやすいときには、その結論が短縮されていないかどうか、疑ってみるべきと思われるが、いかがだろうか。

www.nli-research.co.jp

 

意水準はなぜ慣例的に5%なのか?

 

統計的有意性と P 値に関する ASA 声明
ASA:アメリカ統計協会(American Statistical Association )