跳到主要內容
實證庫 Evidence Lab

看懂研究設計:世代、病例對照、橫斷面、RCT 差在哪

同樣一句「研究顯示」,證據力可能差很多。白話拆解橫斷面、病例對照、世代、RCT 各能回答什麼問題。

證據等級:專家意見 / 共識 — 經驗判斷,證據強度較低

先講結論:「研究顯示」不是一個證據等級,而是一整個光譜。 同一句「某習慣與某疾病有關」,背後若是橫斷面調查,跟若是隨機對照試驗,可信度可能差上好幾倍。學會分辨常見的人體研究設計、知道每一種「能回答什麼、不能回答什麼」,是看健康新聞最划算的技能。下面由弱到強走一遍。

橫斷面研究:某一刻的快照

橫斷面研究(cross-sectional)是在「同一個時間點」同時量到一群人的暴露與健康狀態。英國公共衛生學院(Faculty of Public Health)的方法學教材形容它「提供某族群在某一時間點疾病或健康特徵頻率的快照」,主要產出的指標是盛行率(prevalence,當下有多少人有某狀況)。

它的弱點也藏在「同時量到」裡:暴露和結果一起測,你分不出誰先誰後。哈佛公衛學院 The Nutrition Source 點明,橫斷面「只能建立那個特定時間點的關聯」,無法談因果。看到「常熬夜的人憂鬱比例較高」這種結果要小心——是熬夜害的,還是憂鬱讓人睡不著?快照分不清。

病例對照研究:從結果回頭找原因

病例對照研究(case-control)反過來做:先找一群「已經生病」的人(cases)和一群「沒生病」的人(controls),再回頭比較兩組過去的暴露差在哪。這招對罕見疾病特別划算——不必追蹤幾萬人等少數人發病,直接從病人下手,快又省。

代價是回憶偏誤(recall bias)。The Nutrition Source 講得很白:這類研究「蒐集過去的資訊,多數人本就難以準確回想;而且生病的人回憶過去行為的方式,往往和沒生病的人不同」。病人更容易拼命回想「我是不是做錯了什麼」,把某些暴露記得特別清楚——這種兩組系統性的回憶落差,會憑空製造出假關聯。

世代研究:先看暴露,再追誰生病

世代研究(cohort)是觀察性設計裡最強的一種。做法是找一大群「還沒生病」的人,先記錄他們的暴露(有沒有抽菸、吃什麼),再往後追蹤幾年到幾十年,看誰發病。因為暴露在前、結果在後,它能確立時序——這正是病例對照與橫斷面難做到的。The Nutrition Source 也指出,世代「通常比病例對照提供更可靠的資訊,因為它不依賴對過去的回憶」。

但世代仍是「觀察」而非「介入」:研究者不指定誰抽菸、誰運動。於是它跨不過觀察性研究的天花板——The Nutrition Source 明說,世代的「結果不能暗示因果,只能看到關聯」。最大的麻煩是混雜因子:愛吃魚的人可能整體更顧健康、收入更高,魚的功勞和背景的功勞分不開。

隨機對照試驗:能談因果的黃金標準

隨機對照試驗(RCT)用一招破解上述所有問題:把受試者隨機分到介入組和對照組。Cochrane Handbook 第 8 章解釋,隨機化若成功,「能避免已知或未知的預後因子影響個別參與者被分到哪一組」,使得「平均而言,每一組在介入開始前的預後都相同」。

關鍵在「未知」兩字:你沒想到要量的混雜因子,也會被隨機化大致均勻地打散到兩組——這是事後的統計調整做不到的。因此 The Nutrition Source 把 RCT 稱為判斷介入是否有效的「黃金標準」,也是少數能較有把握談因果的設計。它的限制是貴、耗時,且有些暴露(例如要人去抽菸)根本不能隨機分配,這時只能退回觀察性研究。

金字塔的頂端

把這些設計疊起來,就是常聽到的「證據金字塔」。Icahn 醫學院 Levy Library 的實證醫學指南指出,「多數人同意,當前設計良好的系統性回顧與統合分析位於金字塔頂端,而專家意見與軼事經驗位於底端」。至於中間,一般實證醫學的金字塔大致由強到弱排成:RCT、觀察性研究(其中世代通常優於病例對照、再優於橫斷面),而動物與實驗室研究則更靠近底層——這是常見的通則框架,不同版本的金字塔分層略有出入。頂端的系統性回顧之所以最高,是因為它用可重現的方法把同一問題的多個研究整合起來,壓低單一研究的偶然與偏差——但前提是餵進去的原始研究夠好。

我的觀點

[已知] 不同設計的證據力確實不同,這是實證醫學的共識,不是個人偏好。[推測] 但我認為一般讀者最該練的,不是背下整座金字塔,而是養成一個反射動作:看到「研究顯示」四個字,先問「這是哪一種研究?」。光是分出「觀察(橫斷面/病例對照/世代)vs 介入(RCT)」這一刀,就能擋掉大半把相關當因果的健康新聞。

[已知] 金字塔講的是「設計」的平均優勢,不是「結論」的保證——一篇做得草率的 RCT 未必勝過一篇嚴謹的大型世代研究。[不知道] 至於某一篇特定研究的結論能不能成立,沒讀過全文與它的方法細節,我無法替它背書。設計只是第一道篩子,不是最後一道。(想進一步分清「相關」與「因果」,可參考本站〈相關不等於因果〉與〈系統性回顧與統合分析〉兩篇。)

本文為健康資訊與研究方法整理,不構成醫療建議。如何解讀某一項研究、或將其結論套用到你個人的診斷與治療決策,請與你的醫師或具實證醫學訓練的專業人員討論,並以整體證據而非單一研究為準。

資料來源

每一則主張都對應到下方原始來源。我們優先採用系統性回顧、臨床指引與隨機對照試驗。

  1. 1
    Research Study Types

    Harvard T.H. Chan School of Public Health — The Nutrition Source專家意見 / 共識查證於 2026年6月14日

  2. 2
    Chapter 8: Assessing risk of bias in a randomized trial

    Cochrane Handbook for Systematic Reviews of Interventions臨床指引 / 系統性回顧查證於 2026年6月14日

  3. 3
    Cross-sectional, analytical studies and intervention studies — design, strengths and weaknesses

    Faculty of Public Health — Health Knowledge專家意見 / 共識查證於 2026年6月14日

  4. 4
    The Evidence Hierarchy

    Levy Library, Icahn School of Medicine at Mount Sinai專家意見 / 共識查證於 2026年6月14日

常見問題

看到「研究顯示」第一步該做什麼?

[推測] 先找出它是哪一種設計。橫斷面、病例對照、世代都是觀察性的,原則上只能講「相關」;只有 RCT 能較有把握地談「因果」。同一句結論,背後是橫斷面還是 RCT,可信度差很多。

觀察性研究(橫斷面/病例對照/世代)是不是就不值得看?

不是。它們能涵蓋 RCT 做不到的長期、大樣本、罕見傷害與不能隨機分配的暴露(例如抽菸),是重要的線索與假設來源。重點是把它們當「假設」,不是「定論」。

那直接只看 RCT 和統合分析就好?

[推測] 不建議。RCT 不是每個問題都做得了(有些暴露不能隨機分配),統合分析也可能合併了一堆爛研究。看證據要看設計、品質與整體一致性,而不是只認招牌。