導航:首頁 > 網路數據 > 大數據背景下統計學的發展

大數據背景下統計學的發展

發布時間:2023-01-02 12:17:45

『壹』 大數據來了 給政府統計帶來了機遇與挑戰

大數據來了 給政府統計帶來了機遇與挑戰

對於政府統計機構來說,沒有什麼比數據更重要的了。我們研究統計分類標准、統計調查方法、統計數據採集方式、統計數據加工處理方法、統計數據評估技術,都是為了獲取真實准確、完整及時、代表性強、分類科學、經濟適用的統計數據。

大數據時代的到來,既給政府統計帶來重大發展機遇,也帶來嚴峻挑戰。

一、大數據在政府統計中的應用

國家統計局高度重視大數據在政府統計中的應用。到目前為止,已經與17家大數據企業簽訂了戰略合作協議。當然,目前大數據在中國政府統計中的應用仍處於起步階段,主要表現在兩個方面:一是大數據成為政府統計數據的部分資料來源;二是大數據成為政府統計數據質量的部分評估依據。

(一)大數據成為政府統計數據的部分資料來源

目前,大數據已經成為中國政府統計數據的部分資料來源,以下是幾個有代表性的方面:

1.利用重點網上零售交易平台數據測算網上零售額

為了掌握網上零售交易平台的交易規模和結構,綜合測算網上零售數據,從今年1月份開始,國家統計局實施了月度網上零售交易平台調查,調查范圍為42家重點網上零售交易平台,包括京東商城、亞馬遜、當當網、淘寶網、天貓商城、酒仙網、美團網、中糧我買網、國美在線、大眾點評網等。據對上述42家重點網上零售交易平台數據測算,今年1~8月份,全國網上零售額22400.9億元,同比增長36.5%。其中,實物商品網上零售額18653.4億元,增長35.6%,佔全部網上零售額的83.3%;非實物商品網上零售額3747.5億元,增長41.1%,佔全部網上零售額的16.7%。這對於宏觀管理部門和社會公眾了解網上零售情況具有重要的參考作用。

2.利用房屋交易網簽數據計算全國70個大中城市的新建住宅價格指數

房屋交易網簽數據是指買賣雙方簽訂購房合同後,房地產開發企業在房管部門進行備案,並在房產信息網上公布的相關信息,包含地址、樓層、價格、面積和金額等詳細信息,基本涵蓋了當月新建住宅的全部交易情況。從2011年1月份開始,國家統計局開始採用房屋交易網簽數據計算全國70個大中城市的新建住宅價格指數。這對於提高70個大中城市新建住宅價格指數的數據質量起到了重要作用。

3.利用卓創資訊公司提供的價格信息,開展流通領域重要生產資料市場價格監測

國家統計局與卓創資訊公司開展合作,利用該企業提供的價格信息,開展流通領域重要生產資料市場價格監測。從2014年1月開始,按旬共同向社會發布流通領域9大類50種重要生產資料市場價格的檢測結果。行業涵蓋黑色金屬、有色金屬、化工產品、煤炭、石油天然氣、非金屬建材、農產品、農業生產資料、林產品等領域。地區監測范圍覆蓋北京、天津、河北、山西、內蒙古、遼寧、吉林、上海等24個省區市。這對於宏觀管理部門和社會公眾了解流通領域重要生產資料市場價格信息起到了重要作用。

(二)大數據成為政府統計數據質量的部分評估依據

國家統計局除了把大數據作為政府統計數據的部分資料來源外,也高度重視利用大數據評估政府統計數據質量。以下是目前比較有代表性的兩個方面:一是利用中國銀聯跨行銀行卡消費數據評估社會消費品零售總額數據質量;二是利用大型機械裝備企業物聯網數據評估固定資產投資數據質量。

二、大數據給政府統計帶來的機遇與挑戰

對於政府統計來說,大數據既帶來了重大發展機遇,也帶來嚴峻挑戰。

(一)大數據給政府統計帶來重大發展機遇

首先,大數據將不斷提高政府統計服務宏觀管理和社會公眾的能力。隨著大數據的不斷發展和完善,隨著政府統計機構開發應用大數據能力的不斷提升,政府統計產品的種類將會不斷豐富,政府統計數據的質量和時效性將會不斷提升,從而政府統計服務宏觀管理和社會公眾的能力會不斷提高。

其次,大數據將會推動政府統計發生革命性的變化。隨著大數據的發展和完善,隨著政府統計機構開發應用大數據技術的逐步成熟,政府統計將會發生革命性變化。一是現有的以周期性普查為基礎,以抽樣調查為主體,綜合運用全面調查、重點調查等方法,並充分利用行政記錄等資料的統計調查方法體系可能會發生重大變化。長期以來,抽樣調查方法,即在總體中抽選樣本、利用樣本推算總體的方法;普查和全面調查方法,即對總體中所有單位逐一進行調查的方法,在我國政府統計中發揮了重要作用。今後,在較長的時期內這些方法仍然會被政府統計所廣泛採用。但在大數據不斷發展和完善的情況下,某些領域、某些方面的大數據可能會取代抽樣調查、普查和全面調查方法,成為獲取統計數據的重要方法,而且這種獲取統計數據的方法將會變得越來越重要。二是政府統計中的數據採集方式可能會發生重大變化。長期以來,政府統計機構主要以企業填報、住戶記賬、調查員入戶等方式採集原始數據。在大數據不斷發展和完善的情況下,一部分原始數據將通過挖掘大數據的方式獲取,而且這種新的數據採集方式將會變得越來越重要。三是政府統計的數據處理模式可能會發生重大變化。在大數據不斷發展和完善的情況下,現行的對普查和全面調查數據進行直接審核、匯總、加工處理和對抽樣調查數據進行推算放大的數據處理模式可能會發生重大變化。

(二)大數據給政府統計帶來嚴峻挑戰

首先,大數據對政府統計能力帶來挑戰。從大數據本身的產生到發展完善,從政府統計對大數據的初步運用到成熟運用,需要一個較長的時期。在這個過程中,一方面,政府統計中傳統的統計調查方法、數據採集方式和數據處理模式將繼續運行,否則滿足不了宏觀管理和社會公眾的需求。另一方面,政府統計系統必須投入大量的人力和物力對大數據進行挖掘、加工處理和運用,否則也適應不了大數據時代宏觀管理和社會公眾的需求。這種雙軌運行的模式,對政府統計能力將是一個巨大的挑戰。

其次,大數據對傳統政府統計理念帶來挑戰。傳統的政府統計有一個約定俗成的理念:抽樣調查方法可降低調查成本,提高效率和數據質量。因為抽樣調查只對總體中部分抽中的樣本進行調查,並非對總體中的每一個單位都進行調查,所以調查單位明顯減少,可降低成本,節約時間,提高效率。同時,由於調查單位較少,政府統計機構有能力對基層統計調查人員進行較為扎實的培訓和指導,有精力對統計調查數據進行較為嚴格的檢查和審核,從而能夠提高統計調查數據質量。隨著大數據不斷發展完善,政府統計機構將會越來越多地通過大數據企業間接地獲取統計數據,不需要對總體中的具體單位進行直接調查,不需要調查員,從而也不需要對調查員進行培訓,抽樣調查所具有的調查成本低、能夠提高統計調查數據質量的優點就不復存在了。

以上是小編為大家分享的關於大數據來了 給政府統計帶來了機遇與挑戰的相關內容,更多信息可以關注環球青藤分享更多干貨

『貳』 大數據與統計學有什麼聯系

實際上,雖然在大數據時代背景下,統計學的知識體系產生了一定程度的調整,但是統計學本身的理念與大數據還是具有一定區別的,統計學注重的是方式方法,而大數據則更關注於整個數據價值化的過程,大數據不僅需要統計學知識,還需要具備數學知識和計算機知識。從另一個角度來說,統計學為大數據進行數據價值化奠定了一定的基礎。

從技術體系結構來看,統計學知識主要應用在大數據分析領域,統計學方式是大數據分析的兩種主要方式之一,另一種數據分析方式是機器學習。所以,對於主攻大數據分析方向的研發人員來說,掌握統計學知識還是很有必要的,統計學在數據分析方面已經形成了一個較為系統的知識體系,而且很多技術已經經過了實踐的檢驗。其實對於很多職場人來說,平時大部分的數據分析任務都是基於統計學理論進行的,包括採用的數據分析工具也都屬於統計學領域的范疇。

從未來的發展趨勢來看,一方面統計學會進一步向大數據傾斜,包括目前不少統計學專業的研究生課題,都逐漸開始向大數據方向拓展,另一方面大數據會在發展的初期大量採用統計學相關理論和技術,這也能夠提升大數據相關技術的落地應用能力。

『叄』 統計學專業與大數據有哪些不同統計學就業前景怎麼樣

統計學專業與大數據專業會有一些不同,但總體上是有相同之處都跟網路有關系統計信息數據的。同濟學就業前景比較廣闊,從事的崗位也比較多,可以從事計算工作,也可以從事銷售工作,也可以去銀行工作,這些崗位都是能夠提供的。

因為市場的發展在不斷完善,而且中國傳統貿易化的發展越來越快,統計學工作的相關人員需求量越來越多,需要提供准確的消息,現在是大數據時代,如果統計學學的非常扎實。可以從事的工作也有很多,可以當數據分析師也可以從事銀行金融類證券公司的工作人員。所以這個專業的畢業生需要有很強的技術能力才能有更好的發展,在校學習的知識也會增多。

『肆』 統計學的發展

統計學的發展過程的三個階段
第一階段稱之為「城邦政情」(Matters of state)階段
「城邦政情」階段始於古希臘的亞里斯多德撰寫「城邦政情」或「城邦紀要」。他一共撰寫了一百五十餘種紀要,其內容包括各城邦的歷史,行政,科學,藝術,人口,資源和財富等社會和經濟情況的比較,分析,具有社會科學特點。「城邦政情」式的統計研究延續了一兩千年,直至十七世紀中葉才逐漸被「政治算數」這個名詞所替代,並且很快被演化為「統計學」(Statistics)。統計學依然保留了城邦(state)這個詞根。
第二階段稱之為「政治算數」(Politcal arthmetic)階段
與「城邦政情」階段沒有很明顯的分界點,本質的差別也不大。
「政治算數」的特點是統計方法與數學計算和推理方法開始結合。分析社會經濟問題的方式更加註重運用定量分析方法。
1690年英國威廉·配弟出版 (政治算數)一書作為這個階段的起始標志.
威廉·配弟用數字,重量和尺度將社會經濟現象數量化的方法是近代統計學的重要特徵。因此,威廉?配弟的(政治算數)被後來的學者評價為近代統計學的來源,威廉?配弟本人也被評價為近代統計學之父。
配弟在書中使用的數字有三類:
第一類是對社會經濟現象進行統計調查和經驗觀察得到的數字.因為受歷史條件的限制,書中通過嚴格的統計調查得到的數據少,根據經驗得出的數字多;
第二類是運用某種數學方法推算出來的數字。其推算方法可分為三種:
「(1)以已知數或已知量為基礎,循著某種具體關系進行推算的方法;
(2)通過運用數字的理論性推理來進行推算的方法;
(3)以平均數為基礎進行推算的方法」;
第三類是為了進行理論性推理而採用的例示性的數字.配弟把這種運用數字和符號進行的推理稱之為「代數的演算法」。從配弟使用數據的方法看,「政治算數」階段的統計學已經比較明顯地體現了「收集和分析數據的科學和藝術」特點,統計實證方法和理論分析方法渾然一體,這種方法即使是現代統計學也依然繼承。
第三階段稱之為「統計分析科學」(Science of statistical analysis)階段
在「政治算數」階段出現的統計與數學的結合趨勢逐漸發展形成了「統計分析科學」。
十九世紀末,歐洲大學開設的「國情紀要」或「政治算數」等課程名稱逐漸消失,代之而起的是「統計分析科學」課程.當時的「統計分析科學」課程的內容仍然是分析研究社會經濟問題。
「統計分析科學」課程的出現是現代統計發展階段的開端. 1908年,「學生」氏(William Sleey Gosset的筆名Student)發表了關於t分布的論文,這是一篇在統計學發展史上劃時代的文章。它創立了小樣本代替大樣本的方法,開創了統計學的新紀元。
現代統計學的代表人物首推比利時統計學家奎特萊(Adolphe Quelet),他將統計分析科學廣泛應用於社會科學,自然科學和工程技術科學領域,因為他深信統計學是可以用於研究任何科學的一般研究方法.
現代統計學的理論基礎概率論始於研究賭博的機遇問題,大約開始於1477年。數學家為了解釋支配機遇的一般法則進行了長期的研究,逐漸形成了概率論理論框架。在概率論進一步發展的基礎上,到十九世紀初,數學家們逐漸建立了觀察誤差理論,正態分布理論和最小平方法則。於是,現代統計方法便有了比較堅實的理論基礎。

『伍』 大數據思維下的統計新變革

大數據思維下的統計新變革
日前,谷歌宣布其雲計算平台通過大數據分析准確地預測了巴西世界盃8強。據了解,谷歌雲計算平台使用了英國體育數據提供商Opta Sports的數據,評估了全球每個職業足球聯盟過去多個賽季的情況,以及巴西世界盃小組賽期間的統計數據。於是乎,大數據再度成為輿論關注的焦點,對於其應用價值的討論更加熱烈。
然而,我們發現,即使以谷歌強大的技術實力,也不得不從英國體育數據提供商Opta Sports那裡獲取數據。也就是說,數據的採集並不是谷歌的優勢,大數據產業走向商用和規模化發展,更多的要依賴Opta Sports這樣的數據採集者。從這個角度看,作為最具權威性和採集能力的統計部門,無疑將是大數據產業發展壯大的基礎。反過來看,從大數據發展的趨勢看統計行業的發展方向,也必然全面應用大數據思維。我們注意到,從國家統計局局長馬建堂在2012年年底提出「統計部門要擁抱大數據時代」,到不久前國家統計局在廈門建立首個大數據基地,可以斷言,統計行業的大數據變革已經到來。
2013年11月,國家統計局與網路、阿里巴巴等11家企業簽訂了大數據戰略合作框架協議。此舉目的在於共同推進大數據在政府統計中的應用,不斷增強政府統計的科學性和及時性。馬建堂在協議簽訂時表示:「現在許多發達國家紛紛將大數據利用提升到國家戰略層面,我們也要適應這一大勢,將大數據視為國家戰略資源,主動擁抱大數據時代,積極搶抓機遇、應對挑戰。」數據與統計是一對共生詞,而數據成為生產要素的前提條件也是有效的梳理與歸類,這恰恰是統計的內容。馬建堂說,大數據為政府統計提供了總體性、非結構化、豐富真實的原始資料,可以極大地縮短數據採集時間,減少報表填報任務,減輕調查對象負擔,提高統計數據質量。
一場統計方式和方法的變革正在醞釀。企業既是大數據的主要生產者,也是經驗豐富的使用者,還是大數據的直接受益者,有數據的資源、有應用的技術、有市場的機制。而國家統計局作為組織領導和協調全國統計工作的主管部門,具有統計制度和標准制定,統計數據搜集、發布、分析等方面的優勢。
統計數據是各級領導作出科學決策的重要支撐。隨著企業一套表建設的基本完成,各行各業的數據被採集上來,這只是第一步,用好這些數據是關鍵。企業一套表只是一個業務系統,更重要的是在這套系統上幫助統計部門搭建一套數據資源體系,通過這套體系來對數據進行規劃、整理和加工,建設監測評價中心、輔助決策中心,這也是統計行業未來發展的必然趨勢。
現在一些地方統計局已經開始做統計方面的規劃和使用。例如原來的統計工作主要是查詢,現在希望除了查詢、檢索、展示之外還具備監測、評價的功能。監測評價需要標准,在政府部門這個標准就是政策。監測是對企業、家庭等對象進行調查,數據上傳之後經過計算、加工等與初定的指標相比較,並對監測結果進行評價,發現問題及時預警、報警。輔助決策則更需要智能化,當發現監測評價出的結果與初定指標存在較大差異時,就要追本溯源,為領導提供准確的問題分析報告,列出導致問題的主要原因,提出可行性建議,為領導提供輔助決策,為其做出下一個階段的判斷和調整提供幫助。例如,自去年以來,浙江溫州市統計局建立了GDP聯席會議制度,按季度召集30多個部門進行分析論證部門數據與GDP數據之間的關系,特別是充分運用電力、銀行、交通、財政、外貿等部門數據,以及對GDP數據的影響,使GDP數據更加科學可靠。今年進一步擴大了GDP聯席會議職能,把涉及部門的經濟、社會、民生等監測評價數據進行綜合審查分析,進一步提高統計數據質量。
與此同時,統計行業的大數據變革,也將為大數據產業的下一步發展打造堅實的基礎。從企業一套表到電子終端採集數據,中國統計的技術和制度改革近兩年不斷深入,而與大數據概念的交匯與融合也將助推中國官方數據更加真實全面。統計部門在人口、農業、投資、交通等領域,大力研究利用遙感RS、地理信息系統GIS、全球定位系統GPS為代表的空間信息技術和物聯網技術,既極大提升了統計信息化水平,也為進一步推進大數據的統計應用打下了較好的基礎。

『陸』 統計學專業的學科發展

人類帶著上個千年創造的輝煌跨入新的千年。面對忽忽到來的21世紀,每個人、每個實體、每個學科,乃至整個國家都面臨機遇和挑戰。欲行千里,始於足下,走好21世紀的頭五年,至關重要。在此,我們將對21世紀的頭五年,即中國經濟社會發展的第十個五年計劃中,統計學學科的發展予以厚望。
一、統計學學科的研究發展趨勢
21世紀是知識經濟的時代,信息技術、計算機技術為統計學理論與方法的發展將產生巨大的推動作用。知識創新是時代的基本特徵。統計學理論與方法的創新必將為眾多領域和學科的發展體現出應有的價值。統計學與其他學科的緊密結合將產生新的邊緣學科,許多學科的發展將依賴於統計理論與技術的應用,更為復雜數據的處理方法將成為統計理論界研究的熱點,實用快捷的統計方法與技術將更加普及。
二、十五」期間統計學學科研究的奮斗目標
「九五」期間統計學學科的建立為「十五」已打下了堅實基礎,通過五年的努力,中國統計學理學類一級學科的地位將更加牢固,中國高等統計教育將發生較大的變化,大多數院校的統計專業將改造成適應一級學科地位的統計學,高校統計專業的課程設置將更具有時代特點,統計學理論與方法的應用將在社會主義市場經濟建設中發揮重大作用。有些統計學理論研究與應用將縮小與世界水平的差距,在某些研究方面將達到世界先進水平。
三、「十五」期間統計學研究的重點領域
1.統計理論與方法的創新研究
統計學的生命力就在於應用,應用為統計學的發展賦予活力。
「十五」期間異方差性時間序列問題研究、離散多元統計分析研究、數據挖掘理論研究、異常數據診斷的研究、非參數理論與方法的研究、抽樣與非抽樣誤差理論的研究等將是統計理論研究的熱點。知識經濟、新經濟對統計理論與方法提出更高要求,如何適應電子商務時代統計數據的收集,空間遙感技術的運用等都為統計理論提出新挑戰,統計工作者必須創新出適合各種復雜類型數據的統計方法才能適應實踐的需求。
2.開展空間統計學理論與應用的研究
空間統計學是近幾年統計學發展的一個新領域,主要指運用遙感技術進行國土資源的測定,農業和林業、海洋生物、環境生態的觀測。這種觀測數據通常表現為網路形式,而且這些數據受到大氣效應、觀測工具等諸多因素的影響。空間統計學的應用在於,針對這種特殊的數據,研究誤差控制、數據處理、模型建立、統計推斷。這將是統計學研究的新領域。
計算機技術的發展對統計學發展影響的研究
信息技術與計算機技術的發展是推動新經濟發展的主要動力。可以斷言,沒有計算機的發展就沒有統計方法的普遍有效應用。計算機技術的飛速發展為統計學方法的應用帶來挑戰和發展的機遇。統計數據的收集如何有效藉助網路技術,統計調查方法如何適應現代信息技術,統計數據處理如何深入都將成為研究的熱點問題。
3.生命科學與生物技術中統計方法的應用研究
21世紀是生命科學的世紀,人類不久將完全揭示人類基因排序。19世紀中葉基因學說的創立,就是依賴於統計推斷技術,21世紀生命科學中將有大量的相關研究要藉助統計方法與技術,這個領域的學者將大有作為。21世紀醫學領域的科技創新,將使許多不治之症得到解決,生物制葯將在醫學領域大放異彩,統計學方法在生物制葯技術中的廣泛應用將是不爭的事實。美國輝瑞制葯公司每年投入50億美金用於研究發展,在美的生物統計人員極易找到高薪的工作就足以說明這一領域的廣闊前景。
4.國家經濟安全與金融、保險領域的應用研究
國家的經濟安全及其金融危機的防範問題是中國改革開放中必須高度重視的問題。國家經濟安全、金融危機的預警系統的研究是與統計學方法緊密聯系的研究熱點,投資項目的風險管理研究也將依賴統計學者去研究解決。保險產品的精算理論與實踐在「九五」期間得到一定的進展,為這一領域的深入發展奠定了基礎,如何將發達國家保險精算的理論與中國保險業實際相結合值得深入研究,尤其是保險精算方法向社會保障領域延伸的研究是中國國情賦予給這個領域的迫切任務。
5.政府統計數據質量的進一步研究
政府統計數據的質量在「九五」期間得到國人的普遍關注。不僅國家哲學社科基金設立重點研究課題,幾乎各地方政府也設專項研究,發表的論文已有近百篇。然而這方面的研究還有待深入,不僅從制度上約束、控制數據的可靠性,從檢測、驗證的方法上還需進一步探討。有的重點課題已在檢驗方法上有所突破,但如何具體與中國政府實際數據緊密結合,實施這些方法還須加大力度進行研究和實踐。
6.統計學在社會、人口、教育、環境等領域的應用研究
社會的發展、人口的控制、教育結構的調整與發展、環境的保護等領域存在著大量急待研究的問題,統計學方法是定性與定量研究的有力工具。統計學方法在這些領域將會有廣闊的應用前景。
四、「十五」期間統計學重點研究課題及其簡要論證
1. 中國統計教育發展戰略研究
統計教育是統計科學長期發展的戰略問題。但中國統計教育卻存在著招生難、分配難、經費缺、師資不足、教材陳舊、課程設置不合理等諸多問題。因此,加強統計教育研究也是我們的重要課題。
研究內容包括:統計教育指導思想的研究;統計教育發展目標的研究;統計教育如何適應市場經濟發展的要求,適應現代信息產業與信息技術的要求,適應與國際接軌的要求等問題,要研究統計教育改革與培養目標模式轉換的問題;統計專業培養方案研究;研究統計教育基礎理論課程設置和統計教育辦學層次問題;研究統計教學方法及教學中計算機運用的問題;研究統計師資隊伍建設與培養問題。
理學類一級學科的統計學課程建設的研究
中國大多數院校統計專業的課程設置基本上是前蘇聯的文科模式,這與國際接軌的理學類統計學嚴重不適應。統計學專業應該開設一些什麼課程,這關繫到統計專業是否得到社會認可,是關繫到統計專業生存與發展的大問題。課程建設與課程設置、教材編寫必須高度重視,這應該成為「十五」期間研究解決的主要課題之一。
關於提高政府統計數據質量問題的進一步研究部分統計數據的質量低,可靠性不夠是從上到下各級領導與各界人士廣泛關注的熱點問題之一。提高和保證中國官方統計數據的質量,不僅是政府進行宏觀決策重要保證,也是改善社會風氣重要方面之一。要想從根本上提高和保證官方統計數據的質量,從統計學的角度看,必須解決好以下問題:(1)建立評價統計數據質量的質量標准;(2)對影響統計數據質量的各種因素進行系統分析,找出其中限制性環節;(3)對現有各種統計調查方法的實用性進行比較研究,確定適合中國國情的科學的統計調查方法體系;(4)建立統計數據質量控制體系,選擇適當的方法和控制手段,對統計數據質量實現從指標、設計、調查、匯總到分布的全過程質量控制;(5)宏觀總量數據的科學估算問題研究。這些問題在「九五」期間已得到較多研究,但是檢驗、診斷及控制數據質量的實踐研究須進一步深入。
中國「地下經濟」活動核算的理論和方法研究
過去幾年,中國的「地下經濟」問題表現很突出,並引起人們的關注。「地下經濟」的存在,它的規模多大,性質如何,影響怎樣,會影響到國民生產總值和人民生活水平的正確統計,影響對改革開放成果的評價,也影響到中國經濟政策和調控措施的落實。對「地下經濟」問題的研究、計量已是完善國民經濟核算體系,改善客觀經濟管理的重要內容。西方國家對「地下經濟」的研究已有20多年的歷史,但一直沒有形成十分成熟的理論和方法。結合中國「地下經濟」的具體特點,研究「地下經濟」核算的理論和方法,不僅具有現實意義,也具有國際意義。
對「地下經濟」核算理論與方法的研究主要包括:「地下經濟」的界定與劃分;「地下經濟」的核算范圍;「地下經濟」活動的性質及表現;「地下經濟」的測算方法如直接調查法、間接推演算法、各種測算方法的結合運用;「地下間接」調查方法體系的建立與實施;「地下經濟」對國民經濟核算的影響及分析,「地下經濟」對國民經濟發展影響的統計分析等。這一研究課題在「九五」期間就曾提出,但實質性的進展不大。
關於旅遊經濟、假日經濟和休閑時間的統計研究
「十五」期間中國的經濟結構將得到進一步調整,假日經濟、旅遊經濟將佔一席之地。關於這個領域統計指標體系的建立問題的研究,旅遊客流量、賓館入住率、景點門票收入、餐飲業收入、航空、鐵路等運輸客流量的預測研究等。隨著人民生活水平的提高,生活質量及其休閑時間的規律研究對於制定有關政策,開發市場都具有重要的現實意義。這些都是統計科學應用的新課題。
抽樣技術在社會經濟統計調查中的應用
盡管從理論上講,抽樣技術從樣本容量確定到抽樣估計都已經比較成熟,但在抽樣方法的具體應用過程中卻存在許多難於解決的實際問題。尤其是運用抽樣技術於社會經濟現象的調查中更是如此。當前中國統計制度改革的重要內容之一是推行以抽樣調查為中心,以定期普查為基礎的新統計調查體系。而這要求我們必須解決應用抽樣調查技術所面臨的許多具體實際問題,包括:(1)抽樣調查中國家樣本和地方樣本的協調與配合問題;(2)對於按某一標志代表性抽取的樣本,如何保證其它標志的代表性問題;(3)抽樣調查中的不回答問題;(4)抽樣調查過程中調查誤差的控制問題;(5)對於缺損數據的科學估算問題;(6)抽樣調查方案設計與實施中其它問題。在研究過程中,始終要注意考慮中國的具體國情。「十五」期間更應關注網路技術和通信技術在抽樣調查中的應用研究。
關於中國居民消費模式的量化研究
消費與收入之間有著密切的關系。消費函數是可支配收入與總消費支出之間關系的數學描述。研究中國居民消費與收入之間的關系,量測中國居民的消費水平,探討影響居民消費的主要因素。研究者應考慮到影響消費的眾多因素,利用統計數據,建立消費模型,並總結建立中國消費函數應注意的問題和經驗。
中國第五次人口普查數據資料的深度分析
2000年11月1日的第五次人口普查是跨入21世紀的一次規模最大的統計調查,這些大量數據無疑隱含著非常寶貴的信息,對這些數據的深入挖掘和分析,為國家制定各種宏觀政策將起到巨大作用。過去受統計人員水平和計算機水平所限中國對人口普查數據的挖掘遠不如國外的競爭對手。「十五」期間對第五次人口普查數據的深入分析是中國政府統計界的一大任務。
關於災害損失統計指標與方法的研究
自然災害是人類不能迴避的一個現實問題,幾乎每年都有不同的自然災害,給人民生命財產造成極大損失。總結研究自然災害及其造成的損失具有重大的現實意義。統計指標的建立,數據的收集,規律的探討這是總結和掌握災害規律的重要過程。統計理論和方法在這一領域將會發揮重要作用。
金融市場風險的測度及管理模型研究
金融市場是具有高風險的市場。運用統計方法研究金融風險,建立風險監測系統,不僅能夠為管理層宏觀調控金融市場提供科學的理論依據,而且對投資個人和機構實施風險控制具有重要指導作用。本課題立足中國金融市場,旨在從數量及數量關繫上研究風險的測度方法,風險管理模型的選擇及其管理對策。
SPC技術在產品質量控制中的應用
產品的質量關繫到企業的生存。中國許多企業非常重視產品質量控制,從產品的設計到生產的全過程的質量管理已經有些經驗。但是這方面仍有潛力可挖,特別是統計方法在質量管理中的運用與發達國家差距較大。該課題研究應緊密結合某企業或某產品的生產過程,運用統計方法,實施產品設計、生產的全過程式控制制。這方面的研究可結合企業ISO9000認證進行。還可進一步探討「6」質量標准在中國企業的推廣應用。
高新技術產業的綜合考核與評價研究
關於企業經濟效益的綜合評價研究在過去已有不少,然而高新技術企業的評價考核指標體系的建立仍是一個新問題。高新技術企業與傳統企業的評價指標應有嚴格的不同,應具有高新技術的自身特點。這方面研究需要政府統計與企業統計人員一起進行研究,探討指標體系的建立,數據的收集、數據的分析等。
關於數理統計方法普及和推廣的研究
數理統計方法的科學性已被中國廣大統計工作者所接受,但由於歷史原因,中國社會經濟統計界對數理統計的基本理論和方法了解甚少。許多數理統計方法數學味太濃,實際統計工作者難以掌握。如何普及數理統計方法,使廣大統計工作者容易掌握,並在實踐應用中有很強的可操作性是需研究的問題。研究者需提出切實的可行性方案,並給予論證。
多元統計方法在社會經濟數據處理中的應用
多元統計分析是研究多個變數間相互關系的一個數理統計分支。經濟問題的復雜多樣性,經濟因素間的互相制約性,通過多元分析的一些方法,研究經濟變數之間的相互關系,尋找影響經濟現象的主要因素是非常有效的方法。研究者可結合社會主義建設中的任何具體問題進行研究,並注意總結多元統計方法在實際應用中存在的問題。
時間序列分析在經濟預測中的應用
這里所說的時間序列是隨機時間序列的分析,時間序列分析是數理統計中的一個重要分支。許多經濟指標都可依時間順序得到一串經濟數據,按時間順序排列的經濟數據就是經濟時間序列。利用時間序列方法研究中國的某些經濟指標的變化情況,建立相應的序列分析模型,並用時序模型去預測某經濟指標的未來數值為國家的宏觀調控服務。研究者應注意在中國應用時間序列方法存在的問題,克服中國經濟數據的一些缺陷,大力開展VaR模型技術的應用,總結時序分析在中國應用的經驗。
復雜動態隨機系統的統計學方法研究
在社會、經濟、自然等領域,經常遇到的反映現實的系統都是非常復雜的動態隨機系統,它們的特徵是,系統本身非常復雜,需要用成千上萬個參數進行描述,而且有關數據一般只能通過觀察而非實驗來取得。此外,在這些系統的研究中,隨機化和可重復性難於保證。這樣,就使得現有的各種統計學方法的應用效果不理想。在經濟學研究中,現有各種大規模經濟計量模型在分析預測社會經濟現象及其趨勢時,經常出現失誤,就是一個明顯的例證。究其原因主要有:(1)模型過於抽象,脫離實際太遠;(2)依據的數據質量不高;(3)採取的統計方法要求的前提條件不能滿足。類似的例子在研究許多生態、環境中的大系統問題時也經常出現。
統計方法在教育、考試測量研究中的應用
通過對各種考試現有資料的分析處理,並進行適當的實驗測試分析研究,尋找出各種考試的自身規律和特點,為更好地組織考試提供科學依據。要列舉出考試中各種因素,運用統計方法,分析研究這些因素對考試的影響,找出各主要影響因素,為更有效地控制這些因素提供方法和依據。這方面的研究是多變數的統計方法的應用。多元統計分析方法是這一領域地主要研究工具。
統計學方法在生命科學、生物制葯等領域的應用
生命科學、生物制葯的研究在21世紀將得到飛速發展。這一領域的發展帶動統計學理論與技術的發展,為統計理論和方法找到廣闊的應用領域。通過對這一領域的應用將拓寬統計方法在中國的應用,也必將促進統計方法與理論的完善。
參考文獻:
1.1996——1998年普通高校人文社會科學統計資料匯編
2.教育部人文社會科學研究第二屆優秀成果獎獲獎成果簡介匯編
3.教育部人文社會科學重點研究基地建設試點工作文件匯編
4.普通高等學校人文社會科學研究「九五」規劃咨詢報告匯編
5.全國哲學、社會科學「九五」期間統計學發展回顧與「十五」期間研究的重要領域、方向與研究。

『柒』 大數據時代對統計學和經濟學有何影響

已上提問是統計學基本概念不清楚:有的學者認為大數據時代統計學過時了;實際上:回這是一種錯誤學說,答就是一個大呼悠。所為的大數據就是數據流大一點而已,從數據擴展到信息,並沒有超出統計學描述的范圍;也就是互聯網、計算機、蘋果手機,小朋友手機搖啊搖,小姑娘們聊啊聊,帥哥鍵盤敲啊敲,這些數據、信息、資料、圖片向白雲一樣飄啊飄,飄到空間瞬間形成龐大的幾十萬億的數據雲。最後這些數據流我們用計算機通過統計學專家學者加已整理、分析;這就對統計學家提出了新的挑戰。統計學是通過搜索、整理、分析、描述數據等手段,以達到推斷所測對象的本質,甚至預測對象未來的一門綜合性科學。其中用到了大量的數學及其它學科的專業知識,它的使用范圍幾乎覆蓋了社會科學和自然科學的各個領域。

『捌』 大數據時代下,傳統統計學有哪些變革

「社會統計學與數理統計學的統一」理論的重大意義



王見定教授指出:社會統計學描述的是變數,數理統計學描述的是隨機變數,而變數和隨機變數是兩個既有區別又有聯系,且在一定條件下可以相互轉化的數學概念。王見定教授的這一論述在數學上就是一個巨大的發現。

我們知道「變數」的概念是17世紀由著名數學家笛卡爾首先提出,而「隨機變數」的概念是20世紀30年代以後由蘇聯學者首先提出,兩個概念的提出相差3個世紀。截至到王見定教授,世界上還沒有第二個人提出變數和隨機變數兩者的聯系、區別以及相互的轉化。我們知道變數的提出造就了一系列的函數論、方程論、微積分等重大數學學科的產生和發展;而隨機變數的提出則奠定了概率論和數理統計等學科的理論基礎和促進了它們的蓬勃發展。可見變數、隨機變數概念的提出其價值何等重大,從而把王見定教授在世界上首次提出變數、隨機變數的聯系、區別以及相互的轉化的意義稱為巨大、也就不視為過。

下面我們回到:「社會統計學和數理統計學的統一」理論上來。王見定教授指出社會統計學描述的是變數,數理統計學描述的是隨機變數,這樣王見定教授准確地界定了社會統計學與數理統計學各自研究的范圍,以及在一定條件下可以相互轉化的關系,這是對統計學的最大貢獻。它結束了近400年來幾十種甚至上百種以上五花八門種類的統計學混戰局面,使它們回到正確的軌道上來。

由於變數不斷地出現且永遠地繼續下去,所以社會統計學不僅不會消亡,而且會不斷發展狀大。當然數理統計學也會由於隨機變數的不斷出現同樣發展狀大。但是,對隨機變數的研究一般來說比對變數的研究復雜的多,而且直到今天數理統計的研究尚處在較低的水平,且使用起來比較復雜;再從長遠的研究來看,對隨機變數的研究最終會逐步轉化為對變數的研究,這與我們通常研究復雜問題轉化為若干簡單問題的研究道理是一樣的。既然社會統計學描述的是變數,而變數描述的范圍是極其寬廣的,絕非某些數理統計學者所雲:社會統計學只作簡單的加、減、乘、除。從理論上講,社會統計學應該復蓋除數理統計學之外的絕大多數數學學科的運作。所以王見定教授提出的:「社會統計學與數理統計學統一」理論,從根本上糾正了統計學界長期存在的低估社會統計學的錯誤學說,並從理論上和應用上論證了社會統計學的廣闊前景。

『玖』 大數據時代,統計學還有用嗎

大數據時代,統計學還有用嗎_數據分析師考試

在數據「爆炸」的時代,大數據常常被寄予厚望。到底,什麼樣的數據才算大數據,怎樣才能用好大數據,傳統統計學還有用武之地嗎?清華大學統計學研究中心前不久成立,著名統計學家、哈佛大學終身教授劉軍擔任主任。日前,劉軍做客人民日報、人民網《文化講壇》,分享他的思考。

讓大數據區別於數據的,是其海量積累、高增長率和多樣性

什麼是數據?數據(data)在拉丁文里是「已知」的意思,在英文中的一個解釋是「一組事實的集合,從中可以分析出結論」。籠統地說,凡是用某種載體記錄下來的、能反映自然界和人類社會某種信息的,就可稱之為數據。古人「結繩記事」,打了結的繩子就是數據。步入現代社會,信息的種類和數量越來越豐富,載體也越來越多。數字是數據,文字是數據,圖像、音頻、視頻等都是數據。

什麼是大數據呢?量的增多,是人們對大數據的第一個認識。隨著科技發展,各個領域的數據量都在迅猛增長。有研究發現,近年來,數字數據的數量每3年多就會翻一番。

大數據區別於數據,還在於數據的多樣性。正如高德納咨詢公司研究報告指出的,數據的爆炸是三維的、立體的。所謂的三維,除了指數據量快速增大外,還指數據增長速度的加快,以及數據的多樣性,即數據的來源、種類不斷增加。

從數據到大數據,不僅是量的積累,更是質的飛躍。海量的、不同來源、不同形式、包含不同信息的數據可以容易地被整合、分析,原本孤立的數據變得互相聯通。這使得人們通過數據分析,能發現小數據時代很難發現的新知識,創造新的價值。

通過數據來研究規律、發現規律,貫穿了人類社會發展的始終。人類科學發展史上的不少進步都和數據採集分析直接相關,例如現代醫學流行病學的開端。倫敦1854年發生了大規模的霍亂,很長時間沒有辦法控制。一位醫師用標點地圖的方法研究了當地水井分布和霍亂患者分布之間的關系,發現有一口水井周圍,霍亂患病率明顯較高,藉此找到了霍亂暴發的原因:一口被污染的水井。關閉這口水井之後,霍亂的發病率明顯下降。這種方法,充分展示了數據的力量。

本質上說,許多科學活動都是數據挖掘,不是從預先設定好的理論或者原理出發,通過演繹來研究問題,而是從數據本身出發通過歸納來總結規律。近現代以來,隨著我們面臨的問題變得越來越復雜,通過演繹的方式來研究問題常常變得很困難。這就使得數據歸納的方法變得越來越重要,數據的重要性也越發凸顯出來。

大數據是非競爭性資源,有助於政府科學決策、商家精準營銷

大數據時代,數據的重要作用更加凸顯,許多國家都把大數據提升到國家戰略的高度。

政府合理利用大數據,引導決策的將是基於實證的事實,政府會更有預見性、更加負責、更加開放。中國古代治國就已經有重數據的思想,如商鞅提出,「強國知十三數……欲強國,不知國十三數,地雖利,民雖眾,國愈弱至削」。大數據時代,循「數」治國將更加有效。小數據時代,政府做決策更多依憑經驗和局部數據,難免頭痛醫頭、腳痛醫腳。比如,交通堵塞就多修路。大數據時代,政府做決策能夠從粗放型轉向集約型。路堵了,利用大數據分析,可以得知哪一時間、哪一地段最容易堵,或在這一地段附近多修路,或提前預警引導居民合理安排出行,實現對交通流的最佳配置和控制,改善交通。

對於商家來說,大數據使精準營銷成為可能。一個有趣的故事,是沃爾瑪超市的「啤酒、尿布」現象。沃爾瑪超市分析銷售數據時發現,顧客消費單上和尿布一起出現次數最多的商品,竟然是啤酒。跟蹤調查後發現,有不少年輕爸爸會在買尿布時,順便買些啤酒喝。沃爾瑪發現這一規律後,搭配促銷啤酒、尿布,銷量大幅增加。大數據時代,每個人都會「自發地」提供數據。我們的各種行為,如點擊網頁、使用手機、刷卡消費、觀看電視、坐地鐵出行、駕駛汽車,都會生成數據並被記錄下來,我們的性別、職業、喜好、消費能力等信息,都會被商家從中挖掘出來,以分析商機。

大數據也將使個人受益。從生物學、醫學上講,以前生物學家只是通過對單個或幾個基因的操控來觀察其對生物體的影響,很難發現整體的關聯。現在由於技術的發展,可以分析很多,如遺傳信息、全體基因的表達量信息、蛋白質族譜信息、全基因組甲基化信息、表觀遺傳信息等。同時還有個人健康指標、病歷、葯物反應等數據。如果真能達成生物學上多維多向數據的有機融合,就能夠把個人完整地描述出來,從而實現精準醫療的目的。

大數據時代,審核數據的真實性也有了更有效的手段。大數據的特徵之一是多樣性,不同來源、不同維度的數據之間存在一定的關聯度,可以交叉驗證。例如,某地的工業產值虛報了一倍,但用電量和能耗卻沒有達到相應的規模。這就是數據異常,很容易被系統識別出來。發現異常後,相關部門再進行復核,就能更有針對性地防止、打擊數據造假。

數據是一種資源,但數據又跟煤、石油等物質性資源不一樣。物質性資源不可再生,你用多了,別人就用少了,因而很難共享。數據可以重復使用、不斷產生新的價值。大數據資源的使用是非惡性競爭的,共享的前提下,更能夠製造雙贏。從另一個角度來說,數據如果不被融合、聯系在一起,也不能稱之為大數據。

大數據不能被直接拿來使用,統計學依然是數據分析的靈魂

現在社會上有一種流行的說法,認為在大數據時代,「樣本=全體」,人們得到的不是抽樣數據而是全數據,因而只需要簡單地數一數就可以下結論了,復雜的統計學方法可以不再需要了。

在我看來,這種觀點非常錯誤。首先,大數據告知信息但不解釋信息。打個比方說,大數據是「原油」而不是「汽油」,不能被直接拿來使用。就像股票市場,即使把所有的數據都公布出來,不懂的人依然不知道數據代表的信息。大數據時代,統計學依然是數據分析的靈魂。正如加州大學伯克利分校邁克爾·喬丹教授指出的,「沒有系統的數據科學作為指導的大數據研究,就如同不利用工程科學的知識來建造橋梁,很多橋梁可能會坍塌,並帶來嚴重的後果。」

其次,全數據的概念本身很難經得起推敲。全數據,顧名思義就是全部數據。這在某些特定的場合對於某些特定的問題確實可能實現。比如,要比較清華、北大兩校同學數學能力整體上哪個更強,可以收集到兩校同學高考時的數學成績作為研究的數據對象。從某種意義上說,這是全數據。但是,並不是說我們有了這個全數據就能很好地回答問題。

一方面,這個數據雖然是全數據,但仍然具有不確定性。入校時的數學成績並不一定完全代表學生的數學能力。假如讓所有同學重新參加一次高考,幾乎每個同學都會有一個新的成績。分別用這兩組全數據去做分析,結論就可能發生變化。另一方面,事物在不斷地發展和變化,同學入校時的成績並不能夠代表現在的能力。全體同學的高考成績數據,僅對於那次考試而言是全數據。「全」是有邊界的,超出了邊界就不再是全知全能了。事物的發展充滿了不確定性,而統計學,既研究如何從數據中把信息和規律提取出來,找出最優化的方案;也研究如何把數據當中的不確定性量化出來。

所以說,在大數據時代,數據分析的很多根本性問題和小數據時代並沒有本質區別。當然,大數據的特點,確實對數據分析提出了全新挑戰。例如,許多傳統統計方法應用到大數據上,巨大計算量和存儲量往往使其難以承受;對結構復雜、來源多樣的數據,如何建立有效的統計學模型也需要新的探索和嘗試。對於新時代的數據科學而言,這些挑戰也同時意味著巨大的機遇,有可能會產生新的思想、方法和技術。

以上是小編為大家分享的關於大數據時代,統計學還有用嗎的相關內容,更多信息可以關注環球青藤分享更多干貨

閱讀全文

與大數據背景下統計學的發展相關的資料

熱點內容
g00文件 瀏覽:607
用bat程序刪除程序 瀏覽:516
dnf鬼泣90版本打安圖恩 瀏覽:668
245倒角編程怎麼計算 瀏覽:599
可以買生活用品的app有哪些 瀏覽:175
cad在c盤產生的文件夾 瀏覽:541
聯想手機解鎖工具 瀏覽:696
瑞銀3887win10 瀏覽:833
學網路編程哪個好 瀏覽:805
手機vmos導入的文件在哪裡 瀏覽:115
蘋果手機可以把文件傳到華為嗎 瀏覽:63
海川化工下載的文件默認到哪裡 瀏覽:343
學唱粵語歌app 瀏覽:975
qq游戲生死狙擊玩不了 瀏覽:120
win10郵件不顯示圖片 瀏覽:922
口袋妖怪所有版本下載 瀏覽:504
我們身邊都有哪些大數據例子 瀏覽:25
震旦adc307掃描的文件在哪裡 瀏覽:999
圖片打開變成文件 瀏覽:194
松下微單電腦傳文件軟體 瀏覽:574

友情鏈接