1. 大數據的主要特徵有哪些
大量化(Volume)指數據的數量巨大。日新月異的信息存儲技術使得存儲大量數據的成本越來越低,特別是分布式存儲技術的日益成熟,逐漸使得存儲 PB、EB 甚至 ZB 級別的數據成為可能。
多樣性(Variety)指數據的種類繁多。只需要連上互聯網,就可以隨時隨地查看並獲取想要的數據,但與此同時也面臨了一系列的挑戰。互聯網上的數據雖多,但大部分數據的呈現形式為非結構化或半結構化的。如何將不同的數據結構歸結到統一的結構中是一個重要的問題。
快速化(Velocity)是指目前大數據時代,數據越來越實時化,數據的產生與處理速度逐漸能夠滿足人們的需求。
價值密度低(Value)是大數據中最為關鍵的一點, 雖然真實世界中的數據量極大,但真正有價值的內容 卻較少。以監控視頻為例,雖然監控視頻的內容極其之大,但實際有價值的部分可能不過幾分鍾。如何利用雲計算等技術從大量的數據中提取出最為關鍵、最有價值的部分,並將信息轉換成知識是值得研究的內容。