『壹』 什麼是大數據測試
測試大數據應用程序更多的是驗證其數據處理,而不是測試軟體產品的個別功能版。當涉及到大權數據測試時,性能和功能測試是關鍵。在大數據測試中,QA工程師使用集群和其他組件來驗證對TB級數據的成功處理。因為處理非常快,所以它需要高水平的測試技能。
大數據應用程序的測試更多的是去驗證其數據處理而不是驗證其單一的功能特色。當然在大數據測試時,功能測試和性能測試是同樣很關鍵的。對於大數據測試工程師而言,如何高效正確的驗證經過大數據工具/框架成功處理過的至少百萬兆位元組的數據將會是一個巨大的挑戰。因為大數據高效的處理測試速度,它要求測軟體工程師具備高水平的測試技術才能應對大數據測試。
『貳』 怎樣提升自己的大數據測試經驗
大數據測試三個步驟:
步驟一:數據階段驗證
大數據測試的第一步,也稱作pre-hadoop階段該過程包括如下驗證:
1)來自各方面的數據資源應該被驗證,來確保正確的數據被載入進系統。
2)將源數據與推送到Hadoop系統中的數據進行比較,以確保它們匹配。
3)驗證正確的數據被提取並被載入到HDFS正確的位置。
該階段可以使用工具Talend或Datameer,進行數據階段驗證。
步驟二:"MapRece"驗證
大數據測試的第二步是MapRece的驗證。在這個階段,測試者在每個節點上進行業務邏輯驗證,然後在運行多個節點後驗證它們,確保如下操作的正確性:
1)Map與Rece進程正常工作。
2)在數據上實施數據聚合或隔離規則。
3)生成鍵值對。
4)在執行Map和Rece進程後驗證數據。
步驟三:輸出階段驗證
大數據測試的最後或第三階段是輸出驗證過程。生成輸出數據文件,同時把文件移到一個EDW(Enterprise Data Warehouse:企業數據倉庫)中或著把文件移動到任何其他基於需求的系統中。在第三階段的活動包括:
1)檢查轉換(Transformation)規則被正確應用。
2)檢查數據完整性和成功的數據載入到目標系統中。
3)通過將目標數據與HDFS文件系統數據進行比較來檢查沒有數據損壞。