論文撰寫(xiě)中常見(jiàn)的統(tǒng)計(jì)學(xué)問(wèn)題及其處理
(作者未知) 2009/5/3
絕大多數(shù)的論文撰寫(xiě),均需通過(guò)一定數(shù)量臨床病例(或資料)的觀察,研究事物間的相互關(guān)系,以探討客觀存在的新規(guī)律。如確定新診斷、新治療等措施是否優(yōu)于原沿用的方法,就需進(jìn)行兩種方法比較,這就涉及統(tǒng)計(jì)處理;統(tǒng)計(jì)設(shè)計(jì)又是整個(gè)課題研究設(shè)計(jì)中一個(gè)重要的組成部分。顯然,經(jīng)正確統(tǒng)計(jì)處理的結(jié)果可信度高,論文的質(zhì)量也高。
據(jù)不完全統(tǒng)計(jì),在難以發(fā)表的、已凝聚著作者心血并花費(fèi)較長(zhǎng)時(shí)間與較大財(cái)力撰寫(xiě)的研究論文中,約半數(shù)以上是由于統(tǒng)計(jì)錯(cuò)誤致其結(jié)果與原文主要結(jié)論相違背。如一文采用某新藥引產(chǎn),96例足月孕婦的產(chǎn)后出血與新生兒低Apgar評(píng)分率均為2.1%(各2例),明顯低于應(yīng)用原藥引產(chǎn)的19例,其產(chǎn)后出血與新生兒低Apgar評(píng)分發(fā)生率均為15.8%(各3例,χ2=7.164,P﹤0.001)。故認(rèn)為采用新藥引產(chǎn)是一更安全的措施。原藥引產(chǎn)組例數(shù)偏少暫且不談,該資料比較應(yīng)采用精確法分析,結(jié)果是與原結(jié)果恰恰相反(P﹥0.05),這樣上述的主要結(jié)論就欠可靠而難以發(fā)表,否則論文可起誤導(dǎo)作用。類(lèi)似問(wèn)題文稿中還常有出現(xiàn),F(xiàn)就文稿中常見(jiàn)的統(tǒng)計(jì)問(wèn)題及其相應(yīng)的處理方法簡(jiǎn)述如下。
一、常用的統(tǒng)計(jì)術(shù)語(yǔ)
統(tǒng)計(jì)學(xué)中常用的概念有總體與樣本、隨機(jī)化與概率、計(jì)量與計(jì)數(shù)、等級(jí)資料及正態(tài)與偏態(tài)分布資料、標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤等。如某研究采用經(jīng)會(huì)陰途徑測(cè)定宮頸長(zhǎng)度,以探討不同宮頸長(zhǎng)度與臨產(chǎn)時(shí)間的關(guān)系。結(jié)果顯示35例宮頸長(zhǎng)度為25~34mm者與32例宮頸長(zhǎng)為15~24mm者臨產(chǎn)時(shí)間的均值±標(biāo)準(zhǔn)差(x±s)各為57.6±58.1與47.3±49.1小時(shí)。該計(jì)量資料,經(jīng)t檢驗(yàn)顯示t=0.780,P﹥0.05,并未提示不同宮頸長(zhǎng)度的臨產(chǎn)時(shí)間差異有顯著意義;從標(biāo)準(zhǔn)差大于均值,顯示各變量值離散程度大,呈偏態(tài)分布,故不能采用x±s這一算術(shù)均數(shù)法計(jì)算均數(shù)。經(jīng)偏態(tài)轉(zhuǎn)換成近似正態(tài)分布資料后結(jié)果是:35例與32例的臨產(chǎn)時(shí)間各為34.5±4.1與26.7±4.1小時(shí),(t=7.778,P﹤0.001),兩組差異有極顯著意義。可認(rèn)為隨著宮頸長(zhǎng)度的縮短、臨產(chǎn)時(shí)間也縮短。此外,當(dāng)兩組資料單位不同時(shí),其S單位也不同;即使兩組單位相同的變量值,若其均數(shù)差異較大,也都應(yīng)以變異系數(shù)替代s來(lái)比較兩組值的離散度的大小。
二、正常值范圍及異常閾值的確定
如何選擇研究對(duì)象,至少需多少例,正確統(tǒng)計(jì)處理和參考一定數(shù)量的病例數(shù)據(jù),是確定正常值范圍及異常閾值的四個(gè)重要因素。
1.研究對(duì)象:應(yīng)為“完全健康者”,可包括患有不影響待測(cè)指標(biāo)疾病的患者。如“正常妊娠”的條件:孕前月經(jīng)周期規(guī)則、單胎、妊娠過(guò)程順利、無(wú)產(chǎn)科并發(fā)癥及其它有關(guān)合并癥,分娩孕周為37~41周+6,新生兒出生體重為2500~4000g和Apgar評(píng)分≥7分。
2.觀察數(shù)量:觀察數(shù)量應(yīng)盡可能多于100例;需分組者,各組人數(shù)也是如此(標(biāo)本來(lái)源困難時(shí)酌情減少)。有些指標(biāo)值如雌三醇(E3)、甲胎蛋白(AFP)、胎盤(pán)泌乳素(HPL)等隨孕周進(jìn)展而變化,應(yīng)按孕周分組;鄰近孕周均數(shù)相近者,可合并幾周計(jì)算。若為偏態(tài)分布,應(yīng)以百分位數(shù)計(jì)算,則例數(shù)應(yīng)≥120例。取各孕周對(duì)象時(shí),應(yīng)考慮到所取各孕周中的例數(shù)分布大致均衡。顯然,文稿中往往以少量例數(shù)求得正常值是欠可靠的。
3.統(tǒng)計(jì)處理:應(yīng)根據(jù)所得數(shù)據(jù)分布特征采用不同的統(tǒng)計(jì)處理方法。屬正態(tài)或近似正態(tài)分布的數(shù)據(jù),可采用x±s法計(jì)算;這也適用于以一定方法能將非正態(tài)分布轉(zhuǎn)換成正態(tài)或近似正態(tài)分布的資料。對(duì)無(wú)法轉(zhuǎn)換的偏態(tài)資料,應(yīng)采用百分位數(shù)計(jì)算法。具體計(jì)算(包括上下限初步制定)見(jiàn)文獻(xiàn)。
4.對(duì)照數(shù)量:相應(yīng)觀察的病例數(shù)(包括分組)應(yīng)不少于30例,這對(duì)制定某指標(biāo)有臨床意義的異常閾值尤其重要,這一點(diǎn)往往易被忽視。如在參考較多病例數(shù)據(jù)后,唾液游離E3的下限異常閾值應(yīng)為第2.5百分位數(shù),而非通常采用的5百分位數(shù)。否則,將會(huì)導(dǎo)致該指標(biāo)產(chǎn)前監(jiān)護(hù)的假陽(yáng)性率增加。
三、t檢驗(yàn)與校正t檢驗(yàn)(t′檢驗(yàn))
這是文稿中極易混淆的一類(lèi)計(jì)量資料統(tǒng)計(jì)問(wèn)題。
(一)檢驗(yàn)的注意事項(xiàng)
1.t檢驗(yàn)的意義:t檢驗(yàn)與所有統(tǒng)計(jì)分析相同,其結(jié)果提示現(xiàn)有差別不僅僅是抽樣誤差所致,且提示犯第一類(lèi)錯(cuò)誤的可能性大小,即t0.05與t0.01犯第一類(lèi)錯(cuò)誤的可能性各為5%與1%。
2.統(tǒng)計(jì)意義與臨床意義的關(guān)系:統(tǒng)計(jì)學(xué)有顯著意義,而在臨床上可能是無(wú)意義的,提示該研究應(yīng)繼續(xù)深入,以明確該差異是否真有顯著意義;相反,統(tǒng)計(jì)無(wú)顯著意義,而臨床上卻是有意義的,不能貿(mào)然輕易地下結(jié)論。應(yīng)復(fù)查實(shí)驗(yàn)設(shè)計(jì)、方法、試劑及儀器性能、質(zhì)控措施和實(shí)驗(yàn)數(shù)據(jù)等是否有問(wèn)題,或尚需再進(jìn)一步增加樣本量進(jìn)行復(fù)測(cè)等!
3.t檢驗(yàn)(未完,下一頁(yè))
|