「 ’ 統計的に有意差なし ’ もうやめませんか」Nature に科学者800人超が署名して投稿

確信犯(誤義)なので、何を言っても無駄なんでしょうが。
でじたるでじたる庁利権に支那中共筒抜けの TikTok 使ってみたり、まいなんばー利権に鮮人半島筒抜けの LINE つないでみたり。

クリックで表示

　なぜなら、仮説検定では「帰無（きむ）仮説」と「対立仮説」という概念を用いるからだ。　帰無仮説はとりあえず立てた仮説（多くは検定者が否定したい仮説）であり、帰無仮説が間違っていると確信できる（棄却できる）ときに選ばれるのが対立仮説だ。　薬効の例での帰無仮説は「2群のパラメータは同じ」になる。これを検定手順を踏み棄却することで、「薬を与えた群のパラメータの方が対照群より大きい」という対立仮説を採択できる。　帰無仮説を棄却するかどうかの基準が有意水準だ。帰無仮説の基で計算したある検定統計量がその値となる確率（P値）が、有意水準（多くは5％）を下回れば、帰無仮説は棄却できる。つまり、「2群のパラメータは同じ」という仮説は誤りだと判断されるので、「薬を与えた群のパラメータの方が有意に大きい（薬効がある）」といえる。　問題はP値が有意水準より大きい場合だ。この場合、帰無仮説を棄却できないが、帰無仮説が正しいことも示していない。結果、「2群に有意差があるとはいえない」というあいまいな表現になる。

クリックで表示

　声明では「（あるないの二分法ではなく）統計の不確実性を受け入れる必要がある」とした上で、「（統計的有意差ではなく）信頼区間を使うべきだ」と指摘。さらに、「信頼区間」という単語も「互換区間」（compatibility intervals）に言い換え、計算結果への過剰な信頼を避けるようにすべきだとしている。 ※信頼区間：区間推定において、ある確率（信頼係数）のもとで母数がその内に含まれると推定された区間のこと（統計WEBより）　「統計的有意性の誤用は、科学コミュニティーや科学的なアドバイスを頼る人たちに大きな損害を与えた。P値や信頼区間、その他統計的尺度はそれぞれ存在意義があるが、“統計的有意性”を使うのはもうやめるときだ」（声明） Copyright © ITmedia, Inc. All Rights Reserved.

順序を変えて貼付。

(略) 「猫は人間の話を理解できない」という仮説を立てたとしよう。これに対して、「猫は人間の話を理解できる」という帰無仮説を立てる。実験結果をもとに、ある有意水準で、帰無仮説が棄却されない場合、猫は人間の話を理解できるということが、誤っているとは言えない、と示されたことになる。しかし、だからといって、猫は人間の話を理解できる、と示された訳ではない。

toyokeizai.net

「『誤っているとは言えない、と判断された』というのは、曖昧でやりきれない。せっかく、統計的検定を行ったのに、正誤の判定ができなかったというのは気が引ける。ここは、少し強引にでも、結論を導いてしまおう。棄却されないということは、帰無仮説が正しいということではないか。それならば、『帰無仮説は正しい、と判断された』と述べてしまっていいだろう。」統計学を用いて、結論を導き出したい、と考える人は、こんな風に考えてしまいがちだ。(略)

このように、統計的検定は、帰無仮説が棄却されないときに、結論が冗長となりやすい。そして、結論をわかりやすくしようとして、ついつい短縮してしまいがちになる。短縮された結論は、聞き心地がよく、誤ったまま、理解されてしまいやすい。統計的検定で、得られた結論が、妙にわかりやすいときには、その結論が短縮されていないかどうか、疑ってみるべきと思われるが、いかがだろうか。

順序を戻して貼付。

(略) (統計的検定の)方法は、数学でよく見かける「背理法」に似ている。背理法は、次のような証明法だ。
「Aであることを、証明しようとする。そのために、まず、Aでないことを仮定する。次に、その仮定に従って、論理を進めていき、矛盾を導き出す。そして、この矛盾は、Aでないとの仮定が誤っていたために生じたものだと、帰結する。こうして、Aであることが、証明された、との結論に至る。」

統計的推論では、この背理法に、確率が加わるために、表現がややこしくなる。先ほどの5%のような一定の水準を、「有意水準」と呼ぶ。そして、帰無仮説に基づいて計算した確率が、有意水準よりも小さい場合に、帰無仮説は誤っていると判定する。このことを、
「有意水準5%で、帰無仮説は棄却され、誤っている、と判断された。」
などと、主張することになる。

ややこしいのが、帰無仮説に基づいて計算した確率が、有意水準以上であった場合だ。この場合は、帰無仮説は棄却されない。しかし、棄却されないからといって、帰無仮説が正しいと示された訳ではない。帰無仮説は誤っているとも、正しいとも、示されなかったことになる。この場合、
「有意水準5%では、帰無仮説は棄却されず、誤っているとは言えない、と判断された。」
との結論となる。

「『誤っているとは言えない、と判断された』というのは、曖昧でやりきれない。せっかく、統計的検定を行ったのに、正誤の判定ができなかったというのは気が引ける。ここは、少し強引にでも、結論を導いてしまおう。棄却されないということは、帰無仮説が正しいということではないか。それならば、『帰無仮説は正しい、と判断された』と述べてしまっていいだろう。」統計学を用いて、結論を導き出したい、と考える人は、こんな風に考えてしまいがちだ。次のような、具体例を見てみよう。

toyokeizai.net

「猫は人間の話を理解できない」という仮説を立てたとしよう。これに対して、「猫は人間の話を理解できる」という帰無仮説を立てる。実験結果をもとに、ある有意水準で、帰無仮説が棄却されない場合、猫は人間の話を理解できるということが、誤っているとは言えない、と示されたことになる。しかし、だからといって、猫は人間の話を理解できる、と示された訳ではない。

このように、統計的検定は、帰無仮説が棄却されないときに、結論が冗長となりやすい。そして、結論をわかりやすくしようとして、ついつい短縮してしまいがちになる。短縮された結論は、聞き心地がよく、誤ったまま、理解されてしまいやすい。統計的検定で、得られた結論が、妙にわかりやすいときには、その結論が短縮されていないかどうか、疑ってみるべきと思われるが、いかがだろうか。

www.nli-research.co.jp

有意水準はなぜ慣例的に5％なのか？

統計的有意性と P 値に関する ASA 声明
ASA：アメリカ統計協会（American Statistical Association ）

艤装してます

しばらくかかりそ。サグラダファミリアより遅くなるかも。

「 ’ 統計的に有意差なし ’ もうやめませんか」Nature に科学者800人超が署名して投稿