1920 年代統計學家Fisher 之統計理論體系為機率計算和評估的概念,意指在自變項不受任何影響或操弄的前提下,計算出觀察到的結果之機率,稱為p 值,並且於該研究脈絡下評估該機率值的意涵;而後Neyman 與Pearson 則提出了虛無假設及對立假設的概念,認為假設檢定應包含此兩種假設。兩個派別對於檢定方法雖有所不同,但後世將其整合而形成虛無假設顯著性檢定,並以p 值作為統計資料分析的一個標準設定。然而,近幾年來,學界開始意識到p-hacking 現象,本文稱為「p 值操弄」,意指研究者誤用或濫用資料分析方法,以便得到統計顯著結果,並據此宣稱得到成功的實驗,撰寫研究結果文章投稿至期刊發表。本文針對教育量化研究,首先說明p 值的由來與學理,其次深入探討p 值操弄方式、對教育學領域之學術研究的影響,以及期刊如何偵測與避免p 值操弄。最後,本文提出研究者對p 值應有的正確認知及避免操弄的實務作法,包括在提出統計顯著性的同時,也應提供實務顯著性的證據,確保研究結果的可重製性,詳細陳述分析架構與細節,學習並理性地選擇合適分析技術等。
|