導航:首頁 > 數據分析 > 關系數據主要存在哪裡

關系數據主要存在哪裡

發布時間:2024-11-21 14:16:20

『壹』 大數據是什麼

作者:李麗
鏈接:https://www.hu.com/question/23896161/answer/28624675
來源:知乎
著作權歸作者所有。商業轉載請聯系作者獲得授權,非商業轉載請註明出處。

"大數據"是一個體量特別大,數據類別特別大的數據集,並且這樣的數據集無法用傳統資料庫工具對其內容進行抓取、管理和處理。 "大數據"首先是指數據體量(volumes)?大,指代大型數據集,一般在10TB?規模左右,但在實際應用中,很多企業用戶把多個數據集放在一起,已經形成了PB級的數據量;其次是指數據類別(variety)大,數據來自多種數據源,數據種類和格式日漸豐富,已沖破了以前所限定的結構化數據范疇,囊括了半結構化和非結構化數據。接著是數據處理速度(Velocity)快,在數據量非常龐大的情況下,也能夠做到數據的實時處理。最後一個特點是指數據真實性(Veracity)高,隨著社交數據、企業內容、交易與應用數據等新數據源的興趣,傳統數據源的局限被打破,企業愈發需要有效的信息之力以確保其真實性及安全性。
"大數據"是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。從數據的類別上看,"大數據"指的是無法使用傳統流程或工具處理或分析的信息。它定義了那些超出正常處理范圍和大小、迫使用戶採用非傳統處理方法的數據集。
亞馬遜網路服務(AWS)、大數據科學家JohnRauser提到一個簡單的定義:大數據就是任何超過了一台計算機處理能力的龐大數據量。
研發小組對大數據的定義:"大數據是最大的宣傳技術、是最時髦的技術,當這種現象出現時,定義就變得很混亂。" Kelly說:"大數據是可能不包含所有的信息,但我覺得大部分是正確的。對大數據的一部分認知在於,它是如此之大,分析它需要多個工作負載,這是AWS的定義。當你的技術達到極限時,也就是數據的極限"。 大數據不是關於如何定義,最重要的是如何使用。最大的挑戰在於哪些技術能更好的使用數據以及大數據的應用情況如何。這與傳統的資料庫相比,開源的大數據分析工具的如Hadoop的崛起,這些非結構化的數據服務的價值在哪裡。
二、大數據分析
從所周知,大數據已經不簡簡單單是數據大的事實了,而最重要的現實是對大數據進行分析,只有通過分析才能獲取很多智能的,深入的,有價值的信息。那麼越來越多的應用涉及到大數據,而這些大數據的屬性,包括數量,速度,多樣性等等都是呈現了大數據不斷增長的復雜性,所以大數據的分析方法在大數據領域就顯得尤為重要,可以說是決定最終信息是否有價值的決定性因素。基於如此的認識,大數據分析普遍存在的方法理論有哪些呢?
1、可視化分析
大數據分析的使用者有大數據分析專家,同時還有普通用戶,但是他們二者對於大數據分析最基本的要求就是可視化分析,因為可視化分析能夠直觀的呈現大數據特點,同時能夠非常容易被讀者所接受,就如同看圖說話一樣簡單明了
2、數據挖掘演算法
大數據分析的理論核心就是數據挖掘演算法,各種數據挖掘的演算法基於不同的數據類型和格式才能更加科學的呈現出數據本身具備的特點,也正是因為這些被全世界統計學家所公認的各種統計方法(可以稱之為真理)才能深入數據內部,挖掘出公認的價值。另外一個方面也是因為有這些數據挖掘的演算法才能更快速的處理大數據,如果一個演算法得花上好幾年才能得出結論,那大數據的價值也就無從說起了。
3、預測性分析能力
大數據分析最終要的應用領域之一就是預測性分析,從大數據中挖掘出特點,通過科學的建立模型,之後便可以通過模型帶入新的數據,從而預測未來的數據。
4、數據質量和數據管理
大數據分析離不開數據質量和數據管理,高質量的數據和有效的數據管理,無論是在學術研究還是在商業應用領域,都能夠保證分析結果的真實和有價值。
大數據分析的基礎就是以上五個方面,當然更加深入大數據分析的話,還有很多很多更加有特點的、更加深入的、更加專業的大數據分析方法。
三、大數據技術
1、數據採集:ETL工具負責將分布的、異構數據源中的數據如關系數據、平面數據文件等抽取到臨時中間層後進行清洗、轉換、集成,最後載入到數據倉庫或數據集市中,成為聯機分析處理、數據挖掘的基礎。
2、數據存取:關系資料庫、NOSQL、SQL等。
3、基礎架構:雲存儲、分布式文件存儲等。
4、數據處理:自然語言處理(NLP,NaturalLanguageProcessing)是研究人與計算機交互的語言問題的一門學科。處理自然語言的關鍵是要讓計算機"理解"自然語言,所以自然語言處理又叫做自然語言理解(NLU,NaturalLanguage Understanding),也稱為計算語言學(Computational Linguistics。一方面它是語言信息處理的一個分支,另一方面它是人工智慧(AI, Artificial Intelligence)的核心課題之一。
5、統計分析:假設檢驗、顯著性檢驗、差異分析、相關分析、T檢驗、方差分析、卡方分析、偏相關分析、距離分析、回歸分析、簡單回歸分析、多元回歸分析、逐步回歸、回歸預測與殘差分析、嶺回歸、logistic回歸分析、曲線估計、因子分析、聚類分析、主成分分析、因子分析、快速聚類法與聚類法、判別分析、對應分析、多元對應分析(最優尺度分析)、bootstrap技術等等。
6、數據挖掘:分類
(Classification)、估計(Estimation)、預測(Prediction)、相關性分組或關聯規則(Affinity grouping or
association rules)、聚類(Clustering)、描述和可視化、Description and Visualization)、復雜數據類型挖掘(Text,
Web ,圖形圖像,視頻,音頻等)
7、模型預測:預測模型、機器學習、建模模擬。
8、結果呈現:雲計算、標簽雲、關系圖等。
四、大數據特點
要理解大數據這一概念,首先要從"大"入手,"大"是指數據規模,大數據一般指在10TB(1TB=1024GB)規模以上的數據量。大數據同過去的海量數據有所區別,其基本特徵可以用4個V來總結(Vol-ume、Variety、Value和Veloc-ity),即體量大、多樣性、價值密度低、速度快。
1、
數據體量巨大。從TB級別,躍升到PB級別。
2、
數據類型繁多,如前文提到的網路日誌、視頻、圖片、地理位置信息,等等。
3、
價值密度低。以視頻為例,連續不間斷監控過程中,可能有用的數據僅僅有一兩秒。
4、
處理速度快。1秒定律。最後這一點也是和傳統的數據挖掘技術有著本質的不同。物聯網、雲計算、移動互聯網、車聯網、手機、平板電腦、PC以及遍布地球各個角落的各種各樣的感測器,無一不是數據來源或者承載的方式。
大數據技術是指從各種各樣類型的巨量數據中,快速獲得有價值信息的技術。解決大數據問題的核心是大數據技術。目前所說的"大數據"不僅指數據本身的規模,也包括採集數據的工具、平台和數據分析系統。大數據研發目的是發展大數據技術並將其應用到相關領域,通過解決巨量數據處理問題促進其突破性發展。因此,大數據時代帶來的挑戰不僅體現在如何處理巨量數據從中獲取有價值的信息,也體現在如何加強大數據技術研發,搶占時代發展的前沿。
五、大數據處理
大數據處理之一:採集
大數據的採集是指利用多個資料庫來接收發自客戶端(Web、App或者感測器形式等)的數據,並且用戶可以通過這些資料庫來進行簡單的查詢和處理工作。比如,電商會使用傳統的關系型資料庫MySQL和Oracle等來存儲每一筆事務數據,除此之外,Redis和MongoDB這樣的NoSQL資料庫也常用於數據的採集。
在大數據的採集過程中,其主要特點和挑戰是並發數高,因為同時有可能會有成千上萬的用戶來進行訪問和操作,比如火車票售票網站和淘寶,它們並發的訪問量在峰值時達到上百萬,所以需要在採集端部署大量資料庫才能支撐。並且如何在這些資料庫之間進行負載均衡和分片的確是需要深入的思考和設計。
大數據處理之二:導入/預處理
雖然採集端本身會有很多資料庫,但是如果要對這些海量數據進行有效的分析,還是應該將這些來自前端的數據導入到一個集中的大型分布式資料庫,或者分布式存儲集群,並且可以在導入基礎上做一些簡單的清洗和預處理工作。也有一些用戶會在導入時使用來自Twitter的Storm來對數據進行流式計算,來滿足部分業務的實時計算需求。
導入與預處理過程的特點和挑戰主要是導入的數據量大,每秒鍾的導入量經常會達到百兆,甚至千兆級別。
大數據處理之三:統計/分析
統計與分析主要利用分布式資料庫,或者分布式計算集群來對存儲於其內的海量數據進行普通的分析和分類匯總等,以滿足大多數常見的分析需求,在這方面,一些實時性需求會用到EMC的GreenPlum、Oracle的Exadata,以及基於MySQL的列式存儲Infobright等,而一些批處理,或者基於半結構化數據的需求可以使用Hadoop。
統計與分析這部分的主要特點和挑戰是分析涉及的數據量大,其對系統資源,特別是I/O會有極大的佔用。
大數據處理之四:挖掘
與前面統計和分析過程不同的是,數據挖掘一般沒有什麼預先設定好的主題,主要是在現有數據上面進行基於各種演算法的計算,從而起到預測(Predict)的效果,從而實現一些高級別數據分析的需求。比較典型演算法有用於聚類的Kmeans、用於統計學習的SVM和用於分類的NaiveBayes,主要使用的工具有Hadoop的Mahout等。該過程的特點和挑戰主要是用於挖掘的演算法很復雜,並且計算涉及的數據量和計算量都很大,常用數據挖掘演算法都以單線程為主。
整個大數據處理的普遍流程至少應該滿足這四個方面的步驟,才能算得上是一個比較完整的大數據處理
六、大數據應用與案例分析
大數據應用的關鍵,也是其必要條件,就在於"IT"與"經營"的融合,當然,這里的經營的內涵可以非常廣泛,小至一個零售門店的經營,大至一個城市的經營。以下是關於各行各業,不同的組織機構在大數據方面的應用的案例,在此申明,以下案例均來源於網路,本文僅作引用,並在此基礎上作簡單的梳理和分類。
大數據應用案例之:醫療行業
[1] Seton Healthcare是採用IBM最新沃森技術醫療保健內容分析預測的首個客戶。該技術允許企業找到大量病人相關的臨床醫療信息,通過大數據處理,更好地分析病人的信息。
[2] 在加拿大多倫多的一家醫院,針對早產嬰兒,每秒鍾有超過3000次的數據讀取。通過這些數據分析,醫院能夠提前知道哪些早產兒出現問題並且有針對性地採取措施,避免早產嬰兒夭折。
[3] 它讓更多的創業者更方便地開發產品,比如通過社交網路來收集數據的健康類App。也許未來數年後,它們搜集的數據能讓醫生給你的診斷變得更為精確,比方說不是通用的成人每日三次一次一片,而是檢測到你的血液中葯劑已經代謝完成會自動提醒你再次服葯。
大數據應用案例之:能源行業
[1] 智能電網現在歐洲已經做到了終端,也就是所謂的智能電表。在德國,為了鼓勵利用太陽能,會在家庭安裝太陽能,除了賣電給你,當你的太陽能有多餘電的時候還可以買回來。通過電網收集每隔五分鍾或十分鍾收集一次數據,收集來的這些數據可以用來預測客戶的用電習慣等,從而推斷出在未來2~3個月時間里,整個電網大概需要多少電。有了這個預測後,就可以向發電或者供電企業購買一定數量的電。因為電有點像期貨一樣,如果提前買就會比較便宜,買現貨就比較貴。通過這個預測後,可以降低采購成本。

[2] 維斯塔斯風力系統,依靠的是BigInsights軟體和IBM超級計算機,然後對氣象數據進行分析,找出安裝風力渦輪機和整個風電場最佳的地點。利用大數據,以往需要數周的分析工作,現在僅需要不足1小時便可完成。
大數據應用案例之:通信行業
[1] XO Communications通過使用IBM SPSS預測分析軟體,減少了將近一半的客戶流失率。XO現在可以預測客戶的行為,發現行為趨勢,並找出存在缺陷的環節,從而幫助公司及時採取措施,保留客戶。此外,IBM新的Netezza網路分析加速器,將通過提供單個端到端網路、服務、客戶分析視圖的可擴展平台,幫助通信企業制定更科學、合理決策。
[2] 電信業者透過數以千萬計的客戶資料,能分析出多種使用者行為和趨勢,賣給需要的企業,這是全新的資料經濟。
[3] 中國移動通過大數據分析,對企業運營的全業務進行針對性的監控、預警、跟蹤。系統在第一時間自動捕捉市場變化,再以最快捷的方式推送給指定負責人,使他在最短時間內獲知市場行情。
[4] NTT docomo把手機位置信息和互聯網上的信息結合起來,為顧客提供附近的餐飲店信息,接近末班車時間時,提供末班車信息服務。

『貳』 數據的邏輯結構主要有哪三種各有何特點三者之間存在怎樣的聯系

數據的邏輯結構類型有四種:集合結構、線性結構、樹狀結構和網路結構。

各類型特點:

1、集合結構:集合中任何兩個數據元素之間都沒有邏輯關系,組織形式鬆散。

2、線性結構:數據元素之間存在著「一對一」的線性關系的數據結構。始節點沒有前驅但有一個後繼,終端節點沒有後繼但有一個前驅。其餘節點有且只有一個前驅和一個後繼。

3、樹狀結構:數據元素之間存在「一對多」的關系。一個或多個節點的有限集合。所有節點都可以至少一個後繼。

4、網路結構:通信系統的整體設計,它為網路硬體、軟體、協議、存取控制和拓撲提供標准。數據元素之間存在「多對多」的關系。任何節點都可以有多個前驅和多個後驅。

聯系:

集合結構、線性結構、樹狀結構和網路結構在計算機中的存儲映像不同,但其本質都是邏輯結構,均反映數據元素到存儲區的一個映射關系。

(2)關系數據主要存在哪裡擴展閱讀

邏輯結構設計:

邏輯結構設計是將概念結構設計階段完成的概念模型,轉換成能被選定的資料庫管理系統支持的數據模型,即將E-R模型轉換為關系模型。

把原始數據進行分解、合並後重新組織起來的資料庫全局邏輯結構,包括所確定的關鍵字和屬性、重新確定的記錄結構和文件結構、所建立的各個文件之間的相互關系,形成本資料庫的資料庫管理員視圖等。

『叄』 資料庫中「關系模式」的定義是什麼

關系模式是對關系的描寫敘述。

在資料庫中,關系是元組的集合,所以關系模式要內描寫敘述容元組的集合,當中包含那些屬性,屬性來自域,屬性與域之間的映射關系。

現實世界隨著時間在不斷地變化,因而在不同的時刻,關系模式的關系也會有所變化。但是,現實世界的許多己有事實限定了關系模式所有可能的關系必須滿足一定的完整性約束條件,關系模式應當刻畫出這些完整性約束條件。

(3)關系數據主要存在哪裡擴展閱讀:

1、資料庫中的關系模式是型,而關系是值。

2、關系模式能夠用五元組形式表示:R(U,D,Dom,F),當中R:表示關系名,U:表示屬性集合,Dom,表示屬性域(來自那個域),F:表示函數依賴。

3、可是普通情況下,我們通常把關系模式表示為:R(U)或者R(A,B)(當中A、B代表U中的屬性)

4、關系是n個域的笛卡兒積的子集,組成關系的元組必須是笛卡兒積中使n目謂詞為真的元組。所以關系模式必須描述該關系模式的關系全部元組。

『肆』 一份難得的資料庫市場分析報告

目錄

- 資料庫分類維度:關系型/非關系型、交易型/分析型

- NoSQL資料庫的進一步分類

- OLTP市場規模:關系型資料庫仍占營收大頭

- 資料庫市場份額:雲服務和新興廠商主導NoSQL

- 開源資料庫 vs. 商業資料庫

- 資料庫三大陣營:傳統廠商和雲服務提供商

最近由於時間原因我寫東西少了,在公眾號上也轉載過幾篇搞資料庫朋友的大作。按說我算是外行,沒資格在這個領域品頭論足,而當我看到下面這份報告時立即產生了學習的興趣,同時也想就能看懂的部分寫點心得體會分享給大家。

可能本文比較適合普及性閱讀,讓資料庫領域資深的朋友見笑了:)

資料庫分類維度:關系型/非關系型、交易型/分析型

首先是分類維度,上圖中的縱軸分類為Relational Database(關系型資料庫,RDBMS)和Nonrelational Database (非關系型資料庫,NoSQL),橫軸的分類為Operational(交易型,即OLTP)和Analytical(分析型,即OLAP)。

按照習慣我們先看關系型資料庫,左上角的交易型類別中包括大家熟悉的商業資料庫Oracle、MS SQL Server、DB2、Infomix,也包括開源領域流行的MySQL(MariaDB是它的一個分支)、PostgreSQL,還有雲上面比較常見的SQL Azure和Amazon Aurora等。

比較有意思的是,SAP HANA正好位於交易型和分析型的中間分界處,不要忘了SAP還收購了Sybase,盡管後者今天不夠風光了,而早年微軟的SQL Server都是來源於Sybase。Sybase的ASE資料庫和分析型Sybase IQ還是存在的。

右上角的分析型產品中包括幾款知名的列式數據倉庫Pivotal Greenplum、Teradata和IBM Netezza(已宣布停止支持),來自互聯網巨頭的Google Big Query和Amazon RedShift。至於Oracle Exadata一體機,它上面運行的也是Oracle資料庫,其最初設計用途是OLAP,而在後來發展中也可以良好兼顧OLTP,算是一個跨界產品吧。

再來看非關系型資料庫,左下角的交易型產品中,有幾個我看著熟悉的MongoDB、Redis、Amazon DynamoDB和DocumentDB等;右下角的分析型產品包括著名的Hadoop分支Cloudera、Hortonworks(這2家已並購),Bigtable(來自Google,Hadoop中的HBase是它的開源實現)、Elasticsearch等。

顯然非關系型資料庫的分類要更加復雜,產品在應用中的差異化也比傳統關系型資料庫更大。Willian Blair很負責任地對它們給出了進一步的分類。

NoSQL資料庫的進一步分類

上面這個圖表應該說很清晰了。非關系型資料庫可以分為Document-based Store(基於文檔的存儲)、Key-Value Store(鍵值存儲)、Graph-based(圖資料庫)、Time Series(時序資料庫),以及Wide Cloumn-based Store(寬列式存儲)。

我們再來看下每個細分類別中的產品:

文檔存儲 :MongoDB、Amazon DocumentDB、Azure Cosmos DB等

Key-Value存儲 :Redis Labs、Oracle Berkeley DB、Amazon DynamoDB、Aerospike等

圖資料庫 :Neo4j等

時序資料庫 :InfluxDB等

WideCloumn :DataStax、Cassandra、Apache HBase和Bigtable等

多模型資料庫 :支持上面不只一種類別特性的NoSQL,比如MongoDB、Redis Labs、Amazon DynamoDB和Azure Cosmos DB等。

OLTP市場規模:關系型資料庫仍占營收大頭

上面這個基於IDC數據的交易型資料庫市場份額共有3個分類,其中深藍色部分的關系型資料庫(RDBMS,在這里不統計數據挖掘/分析型資料庫)占據80%以上的市場。

Dynamic Database(DDMS,動態資料庫管理系統,同樣不統計Hadoop)就是我們前面聊的非關系型資料庫。這部分市場顯得小(但發展勢頭看好),我覺得與互聯網等大公司多採用開源+自研,而不買商業產品有關。

而遵循IDC的統計分類,在上圖灰色部分的「非關系型資料庫市場」其實另有定義,參見下面這段文字:

資料庫市場份額:雲服務和新興廠商主導NoSQL

請注意,這里的關系型資料庫統計又包含了分析型產品。Oracle營收份額42%仍居第一,隨後排名依次為微軟、IBM、SAP和Teradata。

代表非關系型資料庫的DDMS分類中(這里同樣加入Hadoop等),雲服務和新興廠商成為了主導,微軟應該是因為雲SQL Server的基礎而小幅領先於AWS,這2家一共占據超過50%的市場,接下來的排名是Google、Cloudera和Hortonworks(二者加起來13%)。

上面是IDC傳統分類中的「非關系型資料庫」,在這里IBM和CA等應該主要是針對大型機的產品,InterSystems有一款在國內醫療HIS系統中應用的Caché資料庫(以前也是運行在Power小機上比較多)。我就知道這些,餘下的就不瞎寫了。

開源資料庫 vs. 商業資料庫

按照流行度來看,開源資料庫從2013年到現在一直呈現增長,已經快要追上商業資料庫了。

商業產品在關系型資料庫的佔比仍然高達60.5%,而上表中從這列往左的分類都是開源占優:

Wide Cloumn:開源佔比81.8%;

時序資料庫:開源佔比80.7%;

文檔存儲:開源佔比80.0%;

Key-Value存儲:開源佔比72.2%;

圖資料庫:開源佔比68.4%;

搜索引擎:開源佔比65.3%

按照開源License的授權模式,上面這個三角形越往下管的越寬松。比如MySQL屬於GPL,在互聯網行業用戶較多;而PostgreSQL屬於BSD授權,國內有不少資料庫公司的產品就是基於Postgre哦。

資料庫三大陣營:傳統廠商和雲服務提供商

前面在討論市場份額時,我提到過交易型資料庫的4個巨頭仍然是Oracle、微軟、IBM和SAP,在這里William Blair將他們歸為第一陣營。

隨著雲平台的不斷興起,AWS、Azure和GCP(Google Cloud Platform)組成了另一個陣營,在國外分析師的眼裡還沒有BAT,就像有的朋友所說,國內互聯網巨頭更多是自身業務導向的,在本土發展公有雲還有些優勢,短時間內將技術輸出到國外的難度應該還比較大。(當然我並不認為國內缺優秀的DBA和研發人才)

第三個陣容就是規模小一些,但比較專注的資料庫玩家。

接下來我再帶大家簡單過一下這前兩個陣容,看看具體的資料庫產品都有哪些。

甲骨文的產品,我相對熟悉一些的有Oracle Database、MySQL以及Exadata一體機。

IBM DB2也是一個龐大的家族,除了傳統針對小型機、x86(好像用的人不多)、z/OS大型機和for i的版本之外,如今也有了針對雲和數據挖掘的產品。記得抱枕大師對Informix的技術比較推崇,可惜這個產品發展似乎不太理想。

微軟除了看家的SQL Server之外,在Azure雲上還能提供MySQL、PostgreSQL和MariaDB開源資料庫。應該說他們是傳統軟體License+PaaS服務兩條腿走路的。

如今人們一提起SAP的資料庫就想起HANA,之前從Sybase收購來的ASE(Adaptive Server Enterprise)和IQ似乎沒有之前發展好了。

在雲服務提供商資料庫的3巨頭中,微軟有SQL Server的先天優勢,甚至把它移植到了Linux擁抱開源平台。關系型資料庫的創新方面值得一提的是Amazon Aurora和Google Spanner(也有非關系型特性),至於它們具體好在哪裡我就不裝內行了:)

非關系型資料庫則是Amazon全面開花,這與其雲計算業務發展早並且占據優勢有關。Google當年的三篇經典論文對業界影響深遠,Yahoo基於此開源的Hadoop有一段時間幾乎是大數據的代名詞。HBase和Hive如今已不再是人們討論的熱點,而Bigtable和BigQuery似乎仍然以服務Google自身業務為主,畢竟GCP的規模比AWS要小多了。

最後這張DB-Engines的排行榜,相信許多朋友都不陌生,今年3月已經不是最新的數據,在這里列出只是給大家一個參考。該排行榜幾乎在每次更新時,都會有國內資料庫專家撰寫點評。

以上是我周末的學習筆記,班門弄斧,希望對大家有幫助。

參考資料《Database Software Market:The Long-Awaited Shake-up》

https://blocksandfiles.com/wp-content/uploads/2019/03/Database-Software-Market-White-Paper.pdf

擴展閱讀:《 資料庫&存儲:互相最想知道的事

尊重知識,轉載時請保留全文。感謝您的閱讀和支持!

『伍』 如何做數據分析

數據分析行業應用,一般數據來源:智能手機 感知裝置 物聯網 社群媒體等 雲計算存儲.cda官網有很多行業案例,比如
風能發電業務場景
風力發電機有一個葉片,時間長了就要換,否則不安全,過去這個葉片一般10年換一次,因為沒辦法知道具體產品的使用情況,只能根據以往葉片老化的情況來估算。但這家公司在葉片上裝了感測器,就能檢測每個葉片的具體使用情況了,風大的地方,葉片老化快,可能8年就要換,風力均勻的地方,有些葉片可能用15年,這樣就能節省資本更新的成本了。
而且,過去這家公司只生產設備,這些設備被賣到國外,具體安裝到什麼地方,他是不知道的,有了感測器,公司就能知道這些發電機被安裝到哪裡,這些地方的風力是大是小,一年四季哪天有風哪天有雨,這些數據都可以獲取。根據這些數據,就能知道哪些地區風力資源豐富,有重點地規劃未來市場。傳統的行業利用大數據,就能更好地實現市場預判和銷售提升,分分鍾實現逆襲。

『陸』 為什麼現在很多app進去都要查看我們通訊錄,通話記錄

放在以前,各類APP安裝時需要的許可權其實沒有多少。而現在,哪怕是一款簡簡單單的APP,我們在安裝時會發現它申請的許可權也很多。這是為啥呢?我是 科技 和軟體行業的工作者,所以對這一塊還是比較了解的,現在將一些原因告訴大家:

1、 收集手機號資源 :

其實很多時候,APP安裝時提示需要通訊錄許可權,這個許可權可能和它本身的功能並沒有什麼關系,而是 APP服務商為了收集客戶的資料,為後續的營銷助力 。

2、 風控要求 :

其實很多APP是涉及風控的,比如像金融類APP、小額借貸類的APP,它們 為了風控需要,是要讀取你的通訊錄的,以便必要時能聯繫到你或者你的家人朋友。

所以我們經常在網路上看見,不少年輕人經歷了網路借貸,然後遭到電話轟炸。我們了解了這個原理,其實就可以避免了,比如在安裝這類APP時,通過手機手機嚴格禁止此APP讀取通訊錄許可權,或者做個假的通訊錄即可。

3、 實名制要求 :

隨著工信部對於固話和手機的實名制要求, 現在的手機號已實現全面實名制了 。不像以前在大街上可以買到未實名的臨時手機號,現在行不通了。

因為手機號是實名制的,所以一些 APP就可以通過用戶的手機號綁定來實現實名認證流程,這樣對於用戶而言更加便捷 。按現在的趨勢,未來手機號可能能證明一個人的身份。

綜上,現在各類APP之所以要讀通訊錄,主要原因就是: 收集信息+實名制要求 。為了避免我們信息的泄露,建議大家在安裝APP時拒絕此許可權申請。當然了,有些APP如果讀不了通訊錄許可權,甚至都無法正常運行,對於這類APP,如果必要則開啟通訊錄許可權即可。

前面有回答說APP查看我們的通訊錄和通話記錄,是出於風控和實名制要求,很抱歉,我不認可這個理由哦。網貸/小額貸公司控制風險,要求的是貸款人提供身份證件,本人還要刷臉,聯系電話也要驗證的,哪有事後查看通訊記錄、通話記錄來控制風險的?真這么厲害,網路水軍早被剿滅的乾乾凈凈。

真正的原因, 是 APP開發商利用通訊錄、通話記錄搜集個人隱私信息,無數人的這些信息匯成大數據,然後開發商利用這些大數據完成營銷、推廣,接地氣兒說就是薅羊毛。

那麼,APP開發商是如何利用大數據營銷的呢?

首先,需要搜集用戶信息,APP查看我們的通訊錄、通話記錄就是在搜集信息:通訊錄記載了我們的社交信息(包括朋友、親屬、同事等),而通話記錄可以反映通話頻次、地理信息,從而分析出社交偏好、愛好等重要的個人隱私信息,再根據這些信息推送相應的廣告。

舉個簡單的例子,你的通訊記錄里有外賣電話,而且每個月有6次(列了個日常數字,方便說明)和外賣通話記錄,連續四五個月都是如此,那麼你的個人畫像為喜歡 美食 ,而且愛用外賣的方式解決,APP開發商分析出這條信息後,可以通過APP向你彈送外賣廣告,展開營銷。

實際上,APP開發商還有一種簡單粗暴的營銷推廣方式,查看你的通訊錄後,再通過同步通訊錄的方式,告訴你通訊錄中其他聯系人:」你的好友XX正在使用XXAPP「,通過簡訊的形式誘導他們下載該APP。

總之,除去部分APP為運行 正常 功能(外賣APP、地圖APP必須索要定位許可權,美顏APP必須索要攝像頭許可權,否則無法運用正常功能)而索要用戶必要許可權外,有部分APP向用戶索要過多許可權,就屬於為營銷而惡意侵犯隱私了。

這種APP,如果不是通訊類的還必須要允許訪問通訊錄聯系人等,那麼多半就是個流氓軟體!

一般來說正規的APP只會建議開啟通訊錄,這些APP對我們不會造成太大的影響,它們無非是先根據你的通訊錄幫你找到其他也正在使用這款軟體的朋友,或是「自作主張」的推薦給通訊錄中的其他人,這種許可權我們完全可以選擇不開啟,對正常使用該軟體幾乎沒有任何影響,如果以後需要開啟也可以自己手動打開。

除了正規APP,其他的流氓軟體不但會要求開啟通訊錄、通話記錄,有些甚至會要求必須打開地理位置、允許刪除通話記錄、讀取簡訊等,如果不允許,軟體就無法使用一直閃退,這個時候建議大家還是直接刪掉這個軟體吧,否則你就會像「裸奔」一樣暴露在這款APP面前。

舉個例子,網路地圖也會要求打開地理位置許可權,但不打開同樣可以進入軟體,大不了就是無法獲取當前位置沒辦法導航,手動輸入位置後就可以查看路線了,在這種大數據時代,很多APP都在通過收集用戶個人信息賺錢,如果允許了惡意APP查看通訊錄,他們很有可能會根據你的通話記錄和通訊錄找到你的家人朋友然後把這些電話號捆綁出售。

下載APP時,最好選擇正規的應用商店或官網,下載之前先查看軟體有沒有非常過分的許可權要求以及下載人數和有沒有廣告,並不是說應用商店的軟體就一定是非常安全和正規的,凡事沒有絕對,他們完全可以不帶任何病毒或捆綁插件只需要開啟你的手機許可權,然後販賣。
更多優質內容,請持續關注鎂客網~~

我本身是一個APP開發者 ,所以,知道的較多。

目前,你能知道很多APP需要查看你的通訊錄、通話記錄, 這個事情本身是好事。

安卓手機
放在以前,安卓手機要訪問你的手機內存、通訊錄、通話記錄, 你根本不知道!

為什麼這么說?

在以前,安卓手機系統還沒有那麼完善,但是其用戶已經非常的多了。

需求變多之後,不光催生了一大堆的APP開發人員,也讓某些人,產生了不好的想法。

那個時期,想什麼流氓軟體,你安裝了之後,根本卸載不了。

像什麼劫持APP頁面的流氓APP,也有很多。

系統完善
現在,安卓手機經過這些年的發展,已經越來越完善了。

現在要訪問手機的私密, 就要獲取許可權。

而獲取數據,必須在用戶授權後,才能獲取到數據!
通訊錄,通話記錄用來幹啥?
不同公司的不同APP,都會訪問不同的許可權。

其中,獲取通訊錄許可權的比較多。

那麼獲取這方面許可權為了干什麼?

一種是為了產品更好的推廣 ,當獲取到了通訊錄之後,就可以對比手機中的人群,那些還沒有注冊,那些已經注冊。

沒注冊的可以邀請,注冊了的可以互動,增加用戶粘性。

另一種,就是金融類APP了 ,他們獲取通訊錄,通話記錄,是為了風險控制。

比如說貸款APP,就要獲取你手機的通訊錄信息,來記錄你的聯系人,為了以後方便追帳。

那可以用新手機嗎?

可以,但是這些公司的風控部門查不到通訊錄信息,就會考慮要不要給你放款。

同理,通話記錄也是如此!

當然,是否要授權給對應的APP,需要自己把握,如果你相信這款APP,那就授權,不相信,那就不授權,不使用!

比如,使用一個記事本的APP,它要訪問你的攝像頭、存儲許可權。

但你只想當一個記事本使用,這個時候,你覺得沒必要,就不授權。

如果不授權就用不了,卸了這種流氓軟體,換一個吧!

現在大多數安卓應用都會讀取你的聯系人、位置等許可權。

雖然安卓系統可以禁止這些應用讀取關鍵許可權,但有的應用不開放相關許可權的話就無法啟動,非常令人頭疼。那麼這些應用取得這些許可權究竟有什麼用呢?目前應用經常用到的許可權有以下幾種:

一、聯系人
這是最普遍的,幾乎所有安卓應用都會讀取你的通訊錄聯系人。從功能上來講,讀取聯系人可以判斷你的親朋好友中有沒有人使用同樣的應用。比如微信的「添加朋友」裡面有一個「手機聯系人」,就需要用到手機通訊錄的許可權。通過這個許可權可以看到你的通訊錄中有誰也在用微信,方便添加好友。

當然,通訊錄屬於比較敏感的許可權,正規的應用如果你不給它這個許可權也能夠正常使用,只不過類似查找通訊錄好友的功能就用無法開啟了。

二、位置
幾乎所有的手機應用APP都會要求獲取你的位置,因為只有知道你的位置才能夠確定你是哪裡人,需要什麼生活服務。比如天氣、外賣、叫車、本地新聞等功能,沒有位置許可權根本無法正常工作。如果你把微信的位置許可權給關閉了,它就會拒絕啟動。

另外手機的一些關鍵功能也許要位置全新,比如蘋果的「查找我的iPhone」就是通過定位來實現的,如果關閉了位置功能,就無法定位手機的位置,手機丟失了也就無法再找回來了。

三、讀取和發送簡訊
和簡訊相關的許可權就比較敏感了,因為簡訊中包含了很多隱私內容,比如銀行的帳號、驗證碼甚至密碼等。如果泄露了這些關鍵簡訊內容,後果不堪設想。

而如果給予應用發送簡訊的許可權,一些不正規的應用就有可能會在後台偷偷發送一些訂購收費服務的簡訊,比如彩鈴、 游戲 虛擬道具等。甚至可以在不知不覺中吸干用戶的話費。所以一般情況下應該禁止應用讀取和發送簡訊。

當然,讓應用讀取簡訊也有一個好處,就是當接受驗證碼的時候,應用可以自動讀取驗證碼中的內容,省的用戶再手動填寫驗證碼。這一功能在手機支付等需要驗證碼的場合比較方便。

四、手機識別碼
這個許可權幾乎所有的應用都會用到,手機識別碼可以幫助應用確定你使用的是什麼型號的手機,這對於用戶來說基本上沒有什麼用。但對於應用開發者卻十分有幫助,它可以幫助應用開發者統計使用這款應用的手機型號有哪些,有時候可以針對一些熱門手機開發專門的功能。

比如iPhone 6s之後的蘋果手機都配備了壓感屏幕,一些應用就可以針對這種屏幕設計快捷菜單,並且根據手機識別碼來判斷,如果是iPhone 6s之後的手機,就可以啟動壓感屏幕的功能。

五、攝像頭
很多用戶覺得攝像頭功能十分敏感,擔心應用擁有攝像頭許可權之後會泄露隱私。但是現在很多應用都有掃一掃功能,如果不給它攝像頭許可權,那麼掃一掃就無法正常使用了。當然如果一款應用不具備任何掃碼和拍照功能,卻要求攝像頭許可權,這個時候就需要注意了。

六、讀寫存儲空間
這應該是比較基本的許可權了,因為如果無法讀寫存儲空間的話,應用就無法往手機中增加內容,比如下載和保存圖片、視頻什麼的。 游戲 也許要通過寫入存儲空間來完成版本更新。幾乎所有的應用都會用到讀寫存儲空間的許可權。

目前的手機APP在安裝時都會索取用戶手機上的相應功能,比如讀取通訊錄和通話記錄、定位手機所在位置、攝像頭使用許可權等,有些APP要求的一些許可權與其主要功能毫不相干。手機APP過度索取用戶手機信息,這種情況可以分為三類:一種是申請獲得用戶隱私信息的許可權留作備用,但是並不上傳到其公司伺服器;第二種是申請獲得用戶的隱私信息許可權,然後將用戶的隱私信息上傳到其公司;第三種情況就是濫用已經上傳到公司的用戶隱私,包括用戶的通訊錄、通話記錄及定位等隱私信息。

智能手機普及以後,手機APP尋求的許可權越來越多。目前,一款手機APP只有具備了社交功能,可以做二次營銷,才更有價值,也才能獲得風險投資的青睞。「比如這個手電筒類APP,獲取用戶的定位信息後,就可以推送機主所在位置周邊商家的廣告。藉助對用戶定位信息,這款APP的商業價值就放大了。」

現在很多人習慣在手機上使用打車軟體,拼車在都市白領中也很流行。國內有個拼車手機APP,安裝時要求用戶允許讀取手機里的通訊錄。但是,拼車去年公開提供下載的版本卻偷偷將用戶通訊錄上傳到本公司,而且竟然是以明文的方式上傳用戶手機號碼,沒有加密,任何有能力截獲該信息的人都能看到該手機APP上傳的用戶通訊錄,就如同在讀一個Word文檔一樣。

另外一款手機APP,會將用戶手機里的簡訊內容上傳給本公司,而且在上傳的時候,僅僅做過簡單的編碼。技術人員說,正版軟體使用明文上傳手機用戶隱私信息最大的安全風險在於遭遇中間人攻擊,如手機用戶連接不安全的WiFi後,不法分子攔截了手機和WiFi之間的通信,這些使用明文傳輸的個人隱私數據就會直接被非法獲取。

總結
現在很多手機應用都要求各種各樣的許可權,其中以聯系人、簡訊、位置和手機識別碼最為普遍,一方面是因為這幾個許可權的確是最常用到的。另一方,很多軟體公司也在手機這些和用戶隱私擦邊的敏感數據,然後通過「大數據」、「雲計算」等方式,來判斷用戶的喜好,並推送相關的廣告內容。

比如用戶在手機瀏覽器中搜索某款3C產品的信息,隨後打開某東、某寶的應用之後,有很大機率能夠看到相關3C產品的廣告。這就是因為購物應用讀取了用戶的瀏覽器搜索記錄,然後自動判斷用戶對這些產品有需求,從而開始有針對性的推送相關的廣告。

盡管這些功能會讓人產生隱私被窺探的感覺,但對於人們的日常生活其實也是有一定幫助的。不過有一定需要注意的是,在安裝一些來歷不明的應用時一定要注意避免開放關鍵許可權,比如簡訊的讀取和發送、相冊的讀取等。現在國產手機的系統也都做的十分人性化,在應用使用關鍵許可權的時候都會有彈窗提示,盡可能的保護了用戶的隱私不被泄露。

手機APP調用我們的通訊錄信息可以分為兩種情況:

那麼,一起來看看APP為何會調用通訊錄信息,又該如何避免個人信息的泄露呢?

手機軟體APP為何會查看我們的通訊錄
首先,我們先來說說良性調用,常見需要調用通訊錄的多為一些社交軟體。例如微信、qq、飛聊等軟體,調用我們通訊錄的信息有利於軟體快速的幫助我們建立社交圈,這樣用戶可以靈活的選擇是否添加通訊錄中的好友。同時,通過用戶關系的捆綁,能夠增強用戶使用軟體的黏性,避免用戶出現流失。

其次,我們再來說說惡性調用。分為兩種情況,一類軟體安裝時會詢問您是否授權訪問,一類軟體會偷偷在後台盜用您的相關信息。此類調用並非軟體功能所需,而是淡村的為了獲取個人數據,通過販賣個人數據來獲得非法的利潤。

如何杜絕手機軟體的惡意調用
蘋果的iOS系統相對來說要好一些,只要軟體安裝均需要通過蘋果商城才能下載使用(不過,蘋果手機自帶的後門程序較多,對於信息安全要就較高的也不建議使用)。問題較為嚴重的就是安卓手機,安卓手機軟體安裝的靈活性太強,無法確定隨意安裝的程序中是否存在惡意軟體。這里建議大家使用手機廠家內置的軟體市場進行下載,畢竟所有上傳的軟體已由廠商為我們進行了初次的把關。除此之外,對於較為默生的軟體,安裝時需要調用通訊錄信息時,可以選擇不允許,當軟體具體使用通訊錄信息時在進行放行。

對於一些陌生網站,大家也盡量不要填寫個人數據。例如默些以手機號碼來進行算命的網站,輸入姓名的網站等等,殊不知,個人信息就這樣悄悄的泄露出去。

不知道您是否因為個人信息的泄露遇到騷擾電話呢,最終是如何處理的呢?

現在的手機應用對用戶許可權的索取越來越多,他們的理由是讓軟體可以更好的運行。 實際上,建議大家在安裝完軟體打開後,當提示說索要通訊錄許可權時,盡量點擊取消,不要給通訊錄許可權。 其他的許可權,可根據軟體的性質,適當的給到它,從而保證軟體功能完整。

最近幾年還好了些,因為手機系統的不斷升級,加強了用戶關系,所以軟體索要許可權都有提示,在早期的時候,連提示都沒有,當我們打開軟體後,默認獲取它想要的許可權。

如今人們的很多信息都是保存在手機里的,通訊錄也是最有價值的信息。所以, 很多軟體啟動後在索要一些必要許可權的同時,也會索要通訊錄許可權,這種情況下是可以完全不給它的,而且,不給它也並不會影響使用。

就拿支付寶來說,這是阿里巴巴旗下的APP,不管是安全性還是信任度方面,肯定是問題的吧。但是我也不會給它通訊錄許可權,照樣使用的很正常。雖然每次通過支付寶給手機繳費的時候會提示我打開通訊錄許可權,但我每次都是自己手動輸入,也照樣不會存在使用問題。

試想一下你會發現,連支付寶這樣的軟體不給它通訊錄許可權都可以很好的運行,其他一些功能型的應用(如某某相機、某某天氣等)給它通訊錄許可權有何用?

現在大環境比較好,流氓軟體相對少了很多。但也不乏一些軟體,根本用不到通訊錄,而還是會索要用戶的通訊錄許可權。其實也是為了做營銷、做推廣之類的。在此, 特意提醒大家,對於金融類的APP,一定別給它們通訊錄許可權。否則的話,它們會通過分析你的通訊錄列表、信息等,以後給你或你通訊列表裡的人發各種垃圾廣告。

其實,如果你有留意的話就會發現,大部分APP在使用過程中並沒有需要通訊錄信息的,可是首次打開的時候卻都會索要這一許可權。站在用戶角度來看的話,你可能沒有什麼損失,這只是你不知道,但站在開發商角度的話,它們就又獲取了一批「手機號碼」以及可供它們分析的簡訊「信息」。對於不良的開發商,可能就會做一些別有用心的事兒了。

所以,我給大家的建議就是, 當我們首次打開剛剛安裝的軟體時,不管它是什麼軟體,都不要給它通訊錄許可權。假如在後續使用時候,發現該軟體確實需要此許可權才能正常運行的話,那麼可根據需要決定,要不要給它許可權。這樣,就能很好的保護自己的通訊信息不被泄露。

我是程序員愛編程,我從事互聯網軟體開發多年,我來回答一下這個問題。

我認為一些手機app在運行時會要求獲取相應許可權,我們要根據該app的性質和功能來判斷它是否應該獲取該項許可權。
獲取手機通訊錄訪問許可權

一般情況下,帶有社交性質的app都會要求獲取手機通訊錄的訪問許可權,例如qq、微信、飛聊等等。它的目的是為了根據你通訊錄的手機號為我們推薦你的潛在好友。我們也可以選擇不開啟,app依然可以正常使用,之後我們也可以在軟體設置中手動開啟。

獲取手機位置的許可權
手機定位對於我們來講也非常重要,一般帶有導航性質的app會要求獲取手機位置許可權,例如各種地圖、美團、各種快遞等等。它的目的是定位我們的位置,為我們提供一些身邊的服務。同樣我們也可以選擇不開啟,之後在軟體設置中開啟。

獲取通話記錄的訪問許可權
說實話,這項許可權在我使用的app中還沒有遇到過,估計那些輔助撥號軟體和輔助簡訊軟體會用到吧,例如無憂通話錄音等等。我覺得通話記錄和簡訊過於私密,不建議對任何軟體開通通話記錄和簡訊的訪問許可權。

所以,我們要根據軟體的用途來判斷我們是否需要提供相應的許可權給它, 如果我們不賦予許可權app就不能用,那一定是流氓軟體,一定要遠離。

很簡單啊,人家要你的數據,要你的關系鏈,進行推廣和二次營銷,從而獲得更多的用戶或者收益!

APP讀取通訊錄後就可以知道你這個當前用戶有哪些聯系人,是怎樣一個關系鏈情況,同時通過其後台的大數據進行分析統計,然後再有針對性的對你通訊錄上的人進行騷擾營銷,最簡單的方式可能就是發一條簡訊。

這里我舉個例子,之前我經常收到脈脈的簡訊,上面寫的是這樣的:xx,某某對你很期待!ta向你發出邀請,希望添加你為最重要的職場人脈等等。

我一看,這某某就是我以前的同事,第一反映就想點簡訊中的鏈接。你看,脈脈這營銷手段是可以的吧!其實這就是讀取對方的通訊錄後,系統自動根據通訊錄上的手機號進行自動發送,從而誘導你來安裝他的APP。由於通訊錄上的聯系人,基本上都是和你相關和認識的人,利用這種關系來進行營銷,人們的戒備心理會不自然的下降,很容易上鉤。而脈脈這種方式,還算 是 簡單粗暴的,完全還可以更精準更隱蔽。

所以你知道現在為什麼詐騙電話、垃圾簡訊這么多嗎?很大程度就是我們把自己的信息交出去了,然後人家APP廠商再進行二次開發,好點的廠商就自己用,惡心點的就將你的信息在轉手出去,然後咱們的信息就在黑色產業鏈中被充分利用。

現在我們的手機號承載著太多內容了,很多服務的帳號都是直接以手機號注冊的,雖然注冊時省事了,但是你的帳號安全性也更差了,APP讀取下通訊錄這些信息全有了。所以,對於莫名索取我們通訊錄的APP應該說NO,而不是隨意開放這個許可權,並且是第一讀取時就制止,等後續禁止就已經晚了。
感謝閱讀,給點個贊鼓勵下吧,歡迎關注【羅氏蟲社】,謝謝!

我是一名產品經理,在項目過程中經常會遇到需要獲取用戶設備什麼許可權的問題,其中就包括通訊錄這些。

首先說一下獲取設備某個許可權這件事情,這本身是Android和iOS系統為保護用戶所做的許可權管理行為,app在獲取對應許可權時必須經過用戶同意,否則無法獲得相應信息,所以就有了我們作為用戶經常看到的,新安裝一個app,會提示需要獲取某個許可權的彈框提示。

再說所為什麼要獲取通訊錄,這主要是基於我們的通訊錄,也就是手機號碼,去匹配產品內的用戶,使用場景有看你聯系人好友有哪些,你可以邀請哪些通訊錄好友成為新用戶等等,主要還是基於產品某個功能的需要。但是有時候app確實存在過度索取許可權的情況,如果你覺得這些許可權不想交出去,可以拒絕,只不過相應的功能你就無法使用。

最終的決定權還是在用戶手上。

閱讀全文

與關系數據主要存在哪裡相關的資料

熱點內容
四川省高三大數據考試是什麼 瀏覽:457
導出打開java文件 瀏覽:671
win10藍屏是硬碟壞了么 瀏覽:46
沈陽哪裡適合學編程 瀏覽:811
django19常用版本 瀏覽:521
三國志11保存在哪個文件夾 瀏覽:88
iphone4s加速 瀏覽:108
編程內存和顯卡哪個重要 瀏覽:672
android連接網路列印機 瀏覽:195
linuxsftp如何上傳文件 瀏覽:603
蘋果文件覆蓋 瀏覽:327
網路足彩名人有哪些 瀏覽:639
pc共享網路給電腦 瀏覽:796
linuxkill重啟進程 瀏覽:658
sketchup景觀教程 瀏覽:730
win10管理找不到模塊 瀏覽:472
蘋果手機查看電腦文件 瀏覽:61
微信不訪問視頻文件夾嗎 瀏覽:259
文件夾加密大師注冊碼 瀏覽:1
onedrive怎麼上傳文件 瀏覽:488

友情鏈接