看到「研究顯示」第一步該做什麼？

[推測] 先找出它是哪一種設計。橫斷面、病例對照、世代都是觀察性的，原則上只能講「相關」；只有 RCT 能較有把握地談「因果」。同一句結論，背後是橫斷面還是 RCT，可信度差很多。

觀察性研究（橫斷面／病例對照／世代）是不是就不值得看？

不是。它們能涵蓋 RCT 做不到的長期、大樣本、罕見傷害與不能隨機分配的暴露（例如抽菸），是重要的線索與假設來源。重點是把它們當「假設」，不是「定論」。

那直接只看 RCT 和統合分析就好？

[推測] 不建議。RCT 不是每個問題都做得了（有些暴露不能隨機分配），統合分析也可能合併了一堆爛研究。看證據要看設計、品質與整體一致性，而不是只認招牌。

看懂研究設計：世代、病例對照、橫斷面、RCT 差在哪

先講結論：「研究顯示」不是一個證據等級，而是一整個光譜。 同一句「某習慣與某疾病有關」，背後若是橫斷面調查，跟若是隨機對照試驗，可信度可能差上好幾倍。學會分辨常見的人體研究設計、知道每一種「能回答什麼、不能回答什麼」，是看健康新聞最划算的技能。下面由弱到強走一遍。

橫斷面研究：某一刻的快照

橫斷面研究（cross-sectional）是在「同一個時間點」同時量到一群人的暴露與健康狀態。英國公共衛生學院（Faculty of Public Health）的方法學教材形容它「提供某族群在某一時間點疾病或健康特徵頻率的快照」，主要產出的指標是盛行率（prevalence，當下有多少人有某狀況）。

它的弱點也藏在「同時量到」裡：暴露和結果一起測，你分不出誰先誰後。哈佛公衛學院 The Nutrition Source 點明，橫斷面「只能建立那個特定時間點的關聯」，無法談因果。看到「常熬夜的人憂鬱比例較高」這種結果要小心——是熬夜害的，還是憂鬱讓人睡不著？快照分不清。

病例對照研究：從結果回頭找原因

病例對照研究（case-control）反過來做：先找一群「已經生病」的人（cases）和一群「沒生病」的人（controls），再回頭比較兩組過去的暴露差在哪。這招對罕見疾病特別划算——不必追蹤幾萬人等少數人發病，直接從病人下手，快又省。

代價是回憶偏誤（recall bias）。The Nutrition Source 講得很白：這類研究「蒐集過去的資訊，多數人本就難以準確回想；而且生病的人回憶過去行為的方式，往往和沒生病的人不同」。病人更容易拼命回想「我是不是做錯了什麼」，把某些暴露記得特別清楚——這種兩組系統性的回憶落差，會憑空製造出假關聯。

世代研究：先看暴露，再追誰生病

世代研究（cohort）是觀察性設計裡最強的一種。做法是找一大群「還沒生病」的人，先記錄他們的暴露（有沒有抽菸、吃什麼），再往後追蹤幾年到幾十年，看誰發病。因為暴露在前、結果在後，它能確立時序——這正是病例對照與橫斷面難做到的。The Nutrition Source 也指出，世代「通常比病例對照提供更可靠的資訊，因為它不依賴對過去的回憶」。

但世代仍是「觀察」而非「介入」：研究者不指定誰抽菸、誰運動。於是它跨不過觀察性研究的天花板——The Nutrition Source 明說，世代的「結果不能暗示因果，只能看到關聯」。最大的麻煩是混雜因子：愛吃魚的人可能整體更顧健康、收入更高，魚的功勞和背景的功勞分不開。

隨機對照試驗：能談因果的黃金標準

隨機對照試驗（RCT）用一招破解上述所有問題：把受試者隨機分到介入組和對照組。Cochrane Handbook 第 8 章解釋，隨機化若成功，「能避免已知或未知的預後因子影響個別參與者被分到哪一組」，使得「平均而言，每一組在介入開始前的預後都相同」。

關鍵在「未知」兩字：你沒想到要量的混雜因子，也會被隨機化大致均勻地打散到兩組——這是事後的統計調整做不到的。因此 The Nutrition Source 把 RCT 稱為判斷介入是否有效的「黃金標準」，也是少數能較有把握談因果的設計。它的限制是貴、耗時，且有些暴露（例如要人去抽菸）根本不能隨機分配，這時只能退回觀察性研究。

金字塔的頂端

把這些設計疊起來，就是常聽到的「證據金字塔」。Icahn 醫學院 Levy Library 的實證醫學指南指出，「多數人同意，當前設計良好的系統性回顧與統合分析位於金字塔頂端，而專家意見與軼事經驗位於底端」。至於中間，一般實證醫學的金字塔大致由強到弱排成：RCT、觀察性研究（其中世代通常優於病例對照、再優於橫斷面），而動物與實驗室研究則更靠近底層——這是常見的通則框架，不同版本的金字塔分層略有出入。頂端的系統性回顧之所以最高，是因為它用可重現的方法把同一問題的多個研究整合起來，壓低單一研究的偶然與偏差——但前提是餵進去的原始研究夠好。

我的觀點

[已知] 不同設計的證據力確實不同，這是實證醫學的共識，不是個人偏好。[推測] 但我認為一般讀者最該練的，不是背下整座金字塔，而是養成一個反射動作：看到「研究顯示」四個字，先問「這是哪一種研究？」。光是分出「觀察（橫斷面／病例對照／世代）vs 介入（RCT）」這一刀，就能擋掉大半把相關當因果的健康新聞。

[已知] 金字塔講的是「設計」的平均優勢，不是「結論」的保證——一篇做得草率的 RCT 未必勝過一篇嚴謹的大型世代研究。[不知道] 至於某一篇特定研究的結論能不能成立，沒讀過全文與它的方法細節，我無法替它背書。設計只是第一道篩子，不是最後一道。（想進一步分清「相關」與「因果」，可參考本站〈相關不等於因果〉與〈系統性回顧與統合分析〉兩篇。）

本文為健康資訊與研究方法整理，不構成醫療建議。如何解讀某一項研究、或將其結論套用到你個人的診斷與治療決策，請與你的醫師或具實證醫學訓練的專業人員討論，並以整體證據而非單一研究為準。

看懂研究設計：世代、病例對照、橫斷面、RCT 差在哪

橫斷面研究：某一刻的快照

病例對照研究：從結果回頭找原因

世代研究：先看暴露，再追誰生病

隨機對照試驗：能談因果的黃金標準

金字塔的頂端

我的觀點

資料來源

常見問題

橫斷面研究：某一刻的快照

病例對照研究：從結果回頭找原因

世代研究：先看暴露，再追誰生病

隨機對照試驗：能談因果的黃金標準

金字塔的頂端

我的觀點

資料來源

常見問題

繼續閱讀

勝算比（OR）vs 風險比（RR）：另一個被誤讀的數字

篩檢的兩面：「早期發現」不總是救命，還可能過度診斷

相對風險 vs 絕對風險：健康新聞最常騙你的數字