圖3-18中數據是某監測點6—10月的多環芳烴數據,下面按前述所講的數據審核步驟進行審核。(一)數據的完整性判斷每月16種多環芳烴數據的完整性。根據每月有效樣本量應大于5個的要求,6、8、9、10月的數據量均大于5條,但是7月的數據...[繼續閱讀]
海量資源,盡在掌握
圖3-18中數據是某監測點6—10月的多環芳烴數據,下面按前述所講的數據審核步驟進行審核。(一)數據的完整性判斷每月16種多環芳烴數據的完整性。根據每月有效樣本量應大于5個的要求,6、8、9、10月的數據量均大于5條,但是7月的數據...[繼續閱讀]
圖3-19中數據是某監測點1—3月的多環芳烴數據,按前述所講步驟對數據進行審核:(一)數據的完整性判斷每月16種多環芳烴數據的完整性。根據每月有效樣本量應大于5個的要求,1、2、3月的數據量均大于5條,符合數據完整性要求。(二)數...[繼續閱讀]
[1] 萬學紅,盧雪峰.診斷學[M].北京:人民衛生出版社,2013:7—54.[2] 中華人民共和國國家質量監督檢驗檢疫總局,中國國家標準化標準化管理委員會. GB/T4883—2008,數據的統計處理和解釋—正態樣本離群值的判斷和處理[S].北京:中國標準出版...[繼續閱讀]
由于監測數據的多樣化來源,數據質量常常參差不齊,給數據分析帶來許多困難,進而影響到監測結論的準確性和衛生政策制定的科學性。數據清洗的目的在于查找出異常、重復和邏輯錯誤等問題數據,并進行修正,以便為后續的統計分析...[繼續閱讀]
(一)數據清洗的相關概念和方法數據清洗(data cleanning)是發現并盡量糾正數據錯誤、以減少數據對研究結果影響的過程[1]。它是數據分析前的一個重要步驟,一方面能提高數據質量,另一方面能增強數據的可利用性,是正確得出統計結果...[繼續閱讀]
(一)空氣污染和健康數據中存在的問題及清洗工具的選擇近年來,空氣污染對健康的影響越來越受到國內外的高度關注,大量流行病學研究已經證明空氣污染與許多健康效應有直接或者間接的相關性[13],從輕微的呼吸系統癥狀到心肺疾...[繼續閱讀]
氣象監測數據包含以下監測指標:氣壓(平均氣壓、最高氣壓、最低氣壓)、溫度(平均溫度、最高溫度、最低溫度)、相對濕度(平均相對濕度、最大相對濕度、最小相對濕度)、降水量、日平均風速、日照時數、能見度、霾日。每個指標...[繼續閱讀]
氣象數據可按圖4-1中流程進行清洗:原始數據備份保存后,首先可利用趨勢圖和計數匯總表觀察數據整體分布,大致了解異常值、重復值和缺失值出現情況,其次根據上述清洗規則,進行異常值、重復值和缺失值的定位查找,異常值和重復...[繼續閱讀]
本節主要介紹基于Excel的氣象數據清洗方法,因此清洗過程的各個步驟將主要依靠Excel編寫函數的功能及其自身所帶如插入圖表、條件格式等功能來實現。在進行清洗之前,需將原始數據錄入Excel工作簿,工作簿第一行為表頭,填寫各監測...[繼續閱讀]
以下各步驟操作都是基于氣象監測數據清洗工具包及其配套的測試數據來進行的,并配有相應的案例,讀者可通過閱讀以下內容同時結合光盤學習氣象監測數據清洗工具包的使用方法,氣象監測數據EXCEL工具包見光盤“數據清洗工具包”...[繼續閱讀]