【知識干貨】2020公衛(wèi)執(zhí)業(yè)醫(yī)師衛(wèi)生統(tǒng)計學考點匯總。為幫助大家了解,醫(yī)學教育網(wǎng)編輯搜集相關資料如下:
T檢驗背景及應用介紹
t檢驗是用t分布理論來推論差異發(fā)生的概率,從而比較兩個平均數(shù)的差異是否顯著。它與f檢驗、卡方檢驗并列。t檢驗是戈斯特為了觀測釀酒質量而發(fā)明的。戈斯特在位于都柏林的健力士釀酒廠擔任統(tǒng)計學家,基于Claude Guinness聘用從牛津大學和劍橋大學出來的最好的畢業(yè)生以將生物化學及統(tǒng)計學應用到健力士工業(yè)程序的創(chuàng)新政策。戈斯特于1908年在Biometrika上公布t檢驗,但因其老板認為其為商業(yè)機密而被迫使用筆名(學生)。實際上,跟他合作過的統(tǒng)計學家是知道“學生”的真實身份是戈斯特的。
生存分析的概念
將事件的結果和出現(xiàn)此結果所經歷的時間結合起來分析的統(tǒng)計分析方法。 研究生存現(xiàn)象和響應時間數(shù)據(jù)及其統(tǒng)計規(guī)律的一門學科。
對一個或多個非負隨機變量(生存時間)進行統(tǒng)計分析研究。 對生存時間進行分析和推斷,研究生存時間和結局與眾多影響因素間關系及其程度的統(tǒng)計分析方法。 在綜合考慮相關因素(內因和外因)的基礎上,對涉及生物學、醫(yī)學(臨床、流行病)、工程(可靠性)、保險精算學、公共衛(wèi)生學、社會學和人口學(老齡問題、犯罪、婚姻)、經濟學(市場學)等領域中,與事件(死亡,疾病發(fā)生、發(fā)展和緩解,失效,狀態(tài)持續(xù))發(fā)生的時間(也叫壽命、存活時間或失效時間,統(tǒng)稱生存時間)有關的問題提供相關的統(tǒng)計規(guī)律的分析與推斷方法的學科。
應用標準化法注意事項:
①標準化法的應用范圍很廣。當某個分類變量在兩組中分布不同時,這兩個分類變量就成為兩組頻率比較的混雜因素,標準化的目的是消除混雜因素。
②標準化后的標準化率,已經不再反映當時當?shù)氐膶嶋H水平,只表示相互比較的資料間的相對水平。
③標準化法實質是找一個標準,使兩組得意在一個共同的平臺上進行比較。選擇不同的標準,算出的標準化率也會不同,比較的結果也未必相同,因此報告比較結果時必須說明所選用的標準和理由。
④兩樣本標準化率是樣本值,存在抽樣誤差。比較兩樣本標準化率,當樣本含量較小時,還應作假設檢驗。
頻數(shù)表與頻數(shù)分布圖
(一)基本概念:
頻數(shù) ( frequency ) : 指在一個抽樣資料中,某變量值出現(xiàn)的次數(shù)。
頻數(shù)分布表( frequency distribution table ): 將各數(shù)值變量的值及其相應的頻數(shù)列表,簡稱頻數(shù)表。頻率是表示頻數(shù)出現(xiàn)機率的指標,可用百分數(shù)或小數(shù)表示,頻率為100%或1。
頻數(shù)分布圖( frequency distribution figure ) : 根據(jù)頻數(shù)分布表,以變量值為橫坐標,頻數(shù)為縱坐標,繪制的直方圖。
(二)連續(xù)型變量頻數(shù)表的編制方法:
⒈求全距( Range ,簡記 R ): 是一組資料中最大值(Xmax)與最小值(Xmin)之差,亦稱極差。
2.定組距: 將全距分為若干段,稱為組段。組與組之間的距離,稱為組距;用小寫i 表示。
原則:(1)“組段”數(shù)一般為10-15個;
(2)“組距”一般為R/10取整;
(3)為計算方便根據(jù)組距采取取整數(shù)方法
3.寫組段: 即將全距分為若干段的過程。
原則:(1)第一組段要包括Xmin,最末組段包括 Xmax ;
(2)每組段均用下限值加 “~ ”表示,最終組段同時注明上下限。
4.列表劃記: 根據(jù)預定的組段和組距,用劃記的方法整理原始資料。
(三)頻數(shù)表的用途:
1.揭示頻數(shù)的分布特征:集中趨勢與離散趨勢結合能全面反映頻數(shù)的分布特征
2.揭示頻數(shù)的分布類型
對稱分布 : 集中部位在中部,兩端漸少,左右兩側的基本對稱,為對稱(正態(tài))分布。
正偏 : 集中部位偏于較小值一側(左側),較大值方向漸減少,為正偏態(tài)分布。
負偏 :集中部位偏于較大值一側(右側),較小值方向漸減少,為負偏態(tài)分布。
3.便于發(fā)現(xiàn)某些特大或特小的可疑值。
4.樣本含量足夠大時,以頻率作為概率的估計值。
5.作為陳述資料的形式。
實驗設計的基本要素(Elements of experimental design)
n 處理因素 (treatment factor)、受試對象 (subject)和實驗效應(experimental effect)是實驗設計的3個基本要素.
n 例如,用兩種藥物治療糖尿病病人,觀察比較兩組病人血糖、尿糖的下降情況,這里所用的藥物為處理因素、糖尿病病人為受試對象,血糖值、尿糖值為實驗效應。它們始終貫穿于整個實驗研究過程中,從各方面影響著實驗研究的結果,在實驗設計中必須予以足夠重視。
一、受試對象(subject)
n 受試對象是處理因素作用的客體,實質上就是根據(jù)研究目的確定的觀察目標總體。醫(yī)學研究的受試對象有人和動物,在實驗進行前必須對研究對象的條件作嚴格的規(guī)定,以保證同質性。
n 選擇受試對象應遵循的基本原則:對處理因素敏感;反應必須穩(wěn)定。
(一)動物的選擇
實驗研究中,動物的選擇比較靈活,但要緊緊圍繞著實驗目的選擇動物。
如SARS疫苗的動物實驗,普遍采用的動物模型是恒河猴。
(二)病例的選擇
臨床試驗中,由于受試對象是人,病例的選擇不像動物選擇那樣靈活,在選擇時必須遵循醫(yī)德要求,還必須明確病例的納入標準(inclusion criteria)和排除標準(exclusion criteria )。如對于病人必須有明確的診斷標準,對具體病程、病型、病情、年齡、性別等應有統(tǒng)一的文字規(guī)定,以便執(zhí)行和檢查。
二、處理因素
在實驗過程中,影響實驗結果的因素是多方面的,根據(jù)研究目的可分為處理因素和非處理因素兩類。
(一)處理因素:
根據(jù)研究目的確定的欲施加或欲觀察的、并能引起受試對象直接或間接效應的因素。
這種干預可以是主動施加的,如藥物的種類、劑量、濃度、作用時間等;也可以是客觀存在的,如觀察培養(yǎng)基在空氣中的污染程度與季節(jié)的關系。
(二)非處理因素:
是指除處理因素外的其它對結果有影響或干擾,但研究者并不想通過實驗考察其作用大小的因素。
(三)選擇處理因素應遵循的基本原則
1.要分清處理因素和非處理因素
n 處理因素是根據(jù)研究目的確定的主要因素,一般為研究者所重視,但不能忽略非處理因素的存在,應找出并加以控制,否則會使實驗結果產生混雜效應。
n 例如,研究藥物治療加飲食療法治療糖尿病的效果時,處理因素為藥物治療加飲食療法;而合理的作息時間、運動和其它輔助治療措施也能緩解癥狀,有助于康復,但不是本次研究的處理因素,而是非處理因素。研究者應采取各種措施,盡可能使非處理因素在所比較的各組中基本相同,以便充分顯示處理因素的作用。
2.保持處理因素恒定不變
n 如在進行藥物療效的試驗觀察中,所使用藥物的生產廠家、批號、藥品標準等在整個試驗過程中必須一致。
n 又如欲觀察某種手術的效果,其手術的操作程序應規(guī)格化,主刀醫(yī)師的熟練程度也應盡量接近。
三、實驗效應(experimental effect)
n 實驗效應 是處理因素作用于受試對象的反應和結局,它是通過實驗觀察指標定量或定性地來表達。如果指標選擇不當,未能準確地反應處理因素的作用,那么獲得的研究結果就缺乏科學性,因此選擇好實驗指標是關系研究成敗的重要環(huán)節(jié)。
(一)選擇觀察指標的基本原則
1.客觀性 觀察指標有主觀指標和客觀指標之分。
n 主觀指標 是指由病人回答或醫(yī)生判斷來描述觀察結果,易受心理因素影響,如“疼痛”的觀察。
n 客觀指標 是借助儀器或試驗等進行測量和檢驗來反映客觀結果。盡可能選擇客觀的、定量的指標。
2.準確度和精密度
n 準確度是指所觀察結果的真實程度,即觀測值與真值的接近程度,屬系統(tǒng)誤差
n 精密度是指所觀察結果的深度,即重復觀測時,觀測值與平均值的接近程度,屬隨機誤差。
實驗效應指標既要準確又要精密,而首先是準確可靠。
3.靈敏性
應盡量選擇高靈敏性的指標,即選擇高靈敏性的方法對觀察指標進行測量。靈敏度高的方法,往往費用昂貴,應根據(jù)實驗經費,選擇既相對廉價,靈敏度又高的測量方法。
4.特異性
為了更好地揭示研究問題的本質,觀察指標還應具備一定的特異性。例如,在診斷糖尿病時,測定血糖的特異性就比測定尿糖的特異性要高。
實驗效應指標應當同時兼顧其靈敏性和特異性,盡量使靈敏性和特異性都高。
5.指標的觀察
在臨床試驗過程中,由于對某些非處理因素未加嚴格控制,使這些非處理因素對試驗效應產生干擾,這種干擾所造成的系統(tǒng)誤差叫偏倚(bias),偏倚歪曲了處理因素的真實效應。
隊列研究意義:
大多數(shù)慢性病都是歷時多年的一個過程所形成。在此期間發(fā)生的許多事件都可能起致病作用。對一群人在某種病尚未明顯發(fā)生前,對某個(或某些)可能起病因作用或保護作用的事件的后果進行隨訪監(jiān)測,是一種從“困”觀“果”的研究方法。
隊列研究(又譯為定群研究、群組研究)就是這樣研究病因的一種流行病學方法。研究對象是加入研究時未患所研究疾病的一群人,根據(jù)是否暴露于所研究的病因(或保護因子)或暴露程度而劃分為不同組別,然后在一定期間內隨訪觀察不同組別的該病(或多種疾病)的發(fā)病率或死亡率。如果暴露組(或大劑量組)的率顯著高于未暴露組(或小劑量組)的率,則可認為這種暴露與疾病存在聯(lián)系,并在符合一些條件時有可能是因果聯(lián)系。
各組除了暴露有無或程度不同之外,其他可能影響患病或死亡的重要因素應具有可比性(均衡性)。但并不要求除暴露狀況外一切方面都可比,這在觀察性研究中實際上是做不到的。有些因素可在數(shù)據(jù)分析中得到控制。
隊列研究所觀察的結局是可疑病因引起的效應(發(fā)病或死亡),除了所研究的一種病,還可能與其他多種疾病也有聯(lián)系,這樣就可觀察一個因素的多種效應,而這正是隊列法不可取代的用途。
根據(jù)作為觀察終點的事件在研究開始時是否已經發(fā)生,可把隊列研究分為前瞻性與回顧性兩類。
另有一種雙向型的隊列研究,適于研究對人體兼有短期與長期效應的因素,可用回顧性隊列法研究前者而用前瞻性隊列法研究后者。
還有一種把病例對照法與前瞻法結合起來的設計。其特點是用隊列法建起隊列(研究對象)并隨訪發(fā)現(xiàn)其中發(fā)生的病例,然后用病例對照法調查病例及隊列中適于作對照的一部分人的暴露史。這里,病例與對照都來自一個界定明確、有基線資料記錄的隊列,暴露史的質量較高,還可以有病例尚未發(fā)病時的實驗室檢驗記錄,而且可以省去對占絕對多數(shù)的未發(fā)病成員的暴露史調查。
隊列研究從方法上來說并不比病例對照法復雜,但實際進行起來卻問題較多,因為觀察人數(shù)多、期限長,組織工作復雜,開支龐大。但是,隊列法是一種重要的醫(yī)學觀察方法,已經為解決現(xiàn)代醫(yī)學的一些迫切問題(例如癌癥和心血管病)做出重要貢獻,所以作為臨床醫(yī)生也應該對其原理有所了解,而且這對于科學思維能力和批判地閱讀能力的培養(yǎng),也是大有裨益的。
病例|對照匹配
匹配(matching)或稱配比,即要求對照在某些因素或特征上與病例保持一致,目的是對兩組進行比較時排除匹配因素的干擾。如以年齡做匹配因素,使兩組在年齡構成上類似或一樣,在分析比較兩組資料時,可避免由于兩組年齡構成的差別對疾病和因素關系的影響,從而更真實地反映研究因素與疾病的關系。匹配分為頻數(shù)匹配與個體匹配。
(1)頻數(shù)匹配(frequency matching):
明確或估計出匹配變量每一層的病例數(shù),然后從備選對照中選擇對照,直至達到每層所要求的數(shù)目,不一定要求絕對數(shù)相等,重要的是比例相同。例如,病例組中男女各半,則對照組中也應一樣。
(2)個體匹配(individual matching):
即以病例和對照個體為單位進行匹配。1:1匹配,為每一個病例配一名對照,又稱配對(pair matching),1:2、1:3、…、1:R匹配時,直接稱為匹配。
定量指標一般要求在一定范圍內匹配。例如年齡匹配,病例為50~59歲組,則對照亦應為50~59歲組?;蛘咭髮φ赵凇?歲、±3歲或±5歲等范圍內匹配,如要求對照與病例的年齡之差在±3歲之內,則一個39歲的病例,其對照的年齡應當在36~42歲之間。
在病例對照研究中采用匹配的目的,首先在于提高研究效率,增加分析指標的精確度(即可信區(qū)間變窄)。其次在于控制混雜因素的作用。匹配的特征或變量必須是已知的混雜因子,或有充分的理由懷疑為混雜因子,否則不應匹配。
匹配的同時也增加了選擇對照的難度。而且一旦對某個因素做了匹配,我們將不能再分析該因素與疾病的關系,也不能充分分析它與其他因素的交互作用。把不必要的項目列入匹配,企圖使病例與對照盡量一致,就可能徒然丟失信息,增加工作難度,結果反而降低了研究效率。這種情況稱為匹配過頭(over-matching),應當注意避免。一般除性別、年齡之外,對其他因素是否進行匹配,須持慎重態(tài)度,以防止匹配過頭,徒增費用和難度。
應用直線回歸注意:
1、作回歸分析要有實際意義,不能把毫無關聯(lián)的兩種現(xiàn)象,隨意進行回歸分析,忽視事物現(xiàn)象間的內在聯(lián)系和規(guī)律;如對兒童身高與小樹的生長數(shù)據(jù)進行回歸分析既無道理也無用途。另外,即使兩個變量間存在回歸關系時,也不一定是因果關系,必須結合專業(yè)知識作出合理解釋和結論。
2、直線回歸分析的資料,一般要求應變量Y是來自正態(tài)總體的隨機變量,自變量X可以是正態(tài)隨機變量,也可以是精確測量和嚴密控制的值。若稍偏離要求時,一般對回歸方程中參數(shù)的估計影響不大,但可能影響到標準差的估計,也會影響假設檢驗時P值的真實性。
3、進行回歸分析時,應先繪制散點圖(scatter plot)。若提示有直線趨勢存在時,可作直線回歸分析;若提示無明顯線性趨勢,則應根據(jù)散點分布類型,選擇合適的曲線模型(curvilinear modal),經數(shù)據(jù)變換后,化為線性回歸來解決。一般說,不滿足線性條件的情形下去計算回歸方程會毫無意義,最好采用非線性回歸方程的方法進行分析。
4、繪制散點圖后,若出現(xiàn)一些特大特小的離群值(異常點),則應及時復核檢查,對由于測定、記錄或計算機錄入的錯誤數(shù)據(jù),應予以修正和剔除。否則,異常點的存在會對回歸方程中的系數(shù)a、b的估計產生較大影響。
5、回歸直線不要外延。直線回歸的適用范圍一般以自變量取值范圍為限,在此范圍內求出的估計值稱為內插(interpolation);超過自變量取值范圍所計算的稱為外延(extrapolation)。若無充足理由證明,超出自變量取值范圍后直線回歸關系仍成立時,應該避免隨意外延
定量資料頻數(shù)分布簡介:
將數(shù)據(jù)按照某種標準(標志)劃分成不同的組別,每個組別稱為一個組段。組段之間的距離稱為組距,一般為等距。各組段的觀察值個數(shù)稱為頻數(shù),將分組標志和相應的頻數(shù)列表,即得到頻數(shù)分布表,簡稱頻數(shù)表。
從頻數(shù)表便于觀察離群值和異常值,還可以看出頻數(shù)分布的兩個重要特征:集中趨勢和離散趨勢。集中趨勢是指觀察值向中央部分集中的傾向;離散趨勢是指觀察值的分散情況。
頻數(shù)表還可以揭示頻數(shù)分布的類型,即對稱分布和偏態(tài)分布。對稱分布是指集中位置在中間,左右兩側的頻數(shù)基本對稱。偏態(tài)分布,又稱不對稱型分布,指頻數(shù)分布不對稱,集中位置偏向一側。若集中位置偏向數(shù)值較小的一側,稱為正偏態(tài);若集中位置偏向數(shù)值較大的一側,稱為負偏態(tài)。
頻數(shù)表可以較直觀地揭示數(shù)據(jù)分布的集中趨勢和離散趨勢,而統(tǒng)計指標可從數(shù)量上較準確地描述其集中位置和離散程度。定量資料的頻數(shù)分布類型不同,描述其集中位置和離散程度的指標也不同。
“【知識干貨】2020公衛(wèi)執(zhí)業(yè)醫(yī)師衛(wèi)生統(tǒng)計學考點匯總”的內容由醫(yī)學教育網(wǎng)編輯搜集整理,供大家參考,更多有關公共衛(wèi)生知識的內容,敬請關注醫(yī)學教育網(wǎng)公共衛(wèi)生知識欄目。