導航:首頁 > 網路數據 > 疫情大數據預測分析

疫情大數據預測分析

發布時間:2023-02-15 02:18:50

⑴ 蘭州大學全球疫情預測系統,預測的數據可靠嗎

任何事情的發展,都有事物本身具有的規律性。如果我們可以掌握足夠多的真實數據,就可以建立起這個事物發展的模型。這樣我們就可以依照模型的規律,對這件事的發展進行預測。或者是我們依據原有的數字模型,通過優化影響因素,來達到預測的目地。但是,預測系統並不是萬能的,它只能為事物的發展提供一定的指導意見。

大數據的作用

SIR傳染病模型其實是一個很常見的傳染病模型,這個模型的變形也是很多。其實對於傳染病的預測,如果可以獲得足夠多、足夠真實的數據,就可以對疫情的走向進行預測。這裡面的難點就是大數據的准確性。

如果數據不夠准確,即使模型參數優化的再好,預測系統預測的走勢也是錯誤的。

各位,對於蘭州大學全球疫情預測系統的准確性,您有什麼不同看法,可以在評論區暢所欲言。

⑵ 瀘州疫情高峰期是幾號

瀘州疫情高峰期是2022年12月23日。知名大數據研究專家針對疫情放開之後,首輪各城市感染高峰期大數據預測的分析。根據【城市資料庫】最新數據分析:目前瀘州感染達峰進度35%。中國疾病預防控制中心首席流行病專家吳尊友在《財經》年會上指出:今冬疫情可以概括為一峰三波。從12月中旬到1月中旬將是第一波疫情,第一波以城市為主,逐漸會上升起來。第二波是1月下旬到2月中旬,春節前的人員流動造成第二波疫情上升。第三波是2月下旬到3月中旬,春節後返崗返工。這三波疫情構成了今冬的新冠流行峰,持續大概三個月左右。吳尊友預測,今冬新冠感染率大約為10%到30%。

⑶ 天津放開後疫情高峰期什麼時候過去

首頁

夜城賦

精彩體育賽事專攻 數據免費分析 動態一手掌握
廣告
全國第一波感染高峰時間表,看看你的家鄉在哪時?

EMBA樂園
2023-01-05 21:30
+訂閱
隨著疫情的放開,根據大數據模型預測感染高峰的時間表如下:僅供參考!

1、北京,人口2189萬,第一波感染高峰到達日2022年12月16日,高峰結束日2023年1月22日,達峰進度87%(見達峰進度解釋)

2、深圳,人口1749萬,第一波感染高峰到達日2022年12月23日,高峰結束日2023年1月16日,達峰進度20%

展開剩餘92%
你反對春節期間禁止燃放煙花嗎?

1.3w人表態
不反對
反對

今冬明春新冠和流感疊加流行
廣告

世界盃足球賽事專攻,高清免費在線看!
廣告
推薦閱讀
突發噩耗!60歲知名主持人不幸病逝,因感染新冠致病情惡化
西皮娛樂 2022.12.29 607.7萬+

剛剛!疾控專家終於說實話了,可能80%-90%人都會感染!
冒險旅途 昨天00:14 54.6萬+

全國第一波感染高峰時間表,看看你的家鄉在哪時?
教育天天見 2022.12.26 2.4萬

張文宏:第二波感染高峰期預估出來了,大家不要再盲目樂觀了!
開心的爺三 19小時前 14.6萬+

全國第一波感染高峰時間表,看看你的家鄉在哪時?
東方之心教... 2022.12.29 1.5萬

終於有好消息!專家發現新冠致命弱點:若成功人類將不用再害怕了
浩哥歷史人... 2022.12.24 201.6萬+

不管陽沒陽,建議家人多吃這「2白」,滋潤養肺,身體恢復快
格式娛樂 24小時前 1.7萬

中國自1月8日起優化移民管理政策措施,是否按計劃進行所有的准備工作?外交部回應
北京商報 2小時前 212

全國第一波感染高峰時間表,看看你的家鄉在哪時?
思修考試法... 2022.12.28 4370

全國第一個恢復的城市!!已經出現了!!
聊聊小學家... 2022.12.29 3.2萬

23年養老金上調方案已敲定,滿20年工齡的人有福了,收入拉開差距
簡單過生活 2022.12.16 100.9萬+

WMO秘書長:三重拉尼娜僅帶來暫時有限的冷卻影響!
大西北消息... 1小時前 207

奧密克戎被專家嚴重低估,強烈請求再次封控,核酸檢測回歸國有
孫愛華 19小時前 4.7萬

一路走好!又有3位明星因疫情去世,最小的只有40歲
養殖草食動... 2022.12.27 342.4萬+

郭晶晶病情終究是瞞不住了,難怪霍啟剛那麼疼愛她,真相令人心疼
動漫精靈兒 昨天07:51 31.5萬+

第二波感染高峰什麼時候來?會有多少人感染?專家最新研判
光明網 3天前 66.6萬+
山東傳來不太好的消息,第二波感染高峰馬上到,第三波也不遠了!
軟萌說本地 19小時前 7.6萬

多人「陽」後突然倒地,緊急手術!醫生緊急提醒:都有一個共同點→
昆明信息港 8小時前 10.3萬+
春運回家,這類消毒液不能帶上高鐵!

洞庭湖邊那... 10小時前 51
強奸之後,又自願發生6次性關系,那第一次能定強奸嗎?
地鐵生活記... 2022.12.22 73.1萬+
70歲的王剛生活不易,妻子一月要花上百萬,60歲老來有喜,太難了
科技小躁 6天前 43.1萬+

鍾南山提出大膽設想:新冠可能與人類長期共存,疫苗可能要定期打
小旋時尚 2022.12.26 197.8萬+

楊冪劉愷威實錘復婚!劉愷威直言:我們更希望小檽米有個安穩的家
夕盼運動 5天前 138.2萬+

張文宏等人反駁鍾南山觀點——新冠病毒已變無可變?
財圈社 前天07:09 63.6萬+

【關注】鄉村美百姓富!榮昌去年實施19個「以工代賑」項目
川渝本地消... 2小時前 73

轉陰以後,建議中老年:千萬別省錢,多吃這4樣,營養豐富好得快
豆皮愛美食 5天前 72.5萬+

李晨升級做爸爸!夫妻倆散步有說有笑,孕肚擋不住好事將近!
樂翻車娛樂 2022.12.20 333.6萬+

【人社日課·說卡】1月6日 社保卡更換,能保留以前的銀行賬號嗎?
大西北消息... 2小時前 25

全國第一波感染高峰時間表,看看你的家鄉在哪時?
米先生教育 前天14:03 8490

第二波感染高峰什麼時候來?會有多少人感染?專家最新研判→
東南西北那... 昨天21:05 177
自然資源部辦公廳 國家林業和草原局辦公室關於印發《自然資源調查監測成果管理辦法(試行)》的通知
中部城市生... 6小時前 102
一個真正感染新型冠狀病毒離世的訃告!
妙筆成章 22小時前 6.4萬

頭像
我想說...
+1

推薦搜索
各地感染期高峰圖
全國感染高峰進度表查
全國各城市感染高峰分
全國各城市感染高峰進
全國各城市感染高峰在
全國各城市感染高峰進
網站地圖
新聞財經體育娛樂軍事圖庫汽車房產時尚短視頻歷史科技
用戶反饋
合作
隱私政策
Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版權所有

⑷ 疫情開始時新加坡如何利用大數據分析和控制疫情傳播

隨著信息和通信技術(Information and Communication Technology–ICT)的快速發展和廣泛應用,「智慧城市(Smart City)」已經成為全球各國城市應對人口、環境、資源和管理等挑戰的一種創新方案。尤其是在應對自然災害、事故災難、公共衛生事件和社會安全事件等突發事件的過程中,智慧城市已經成為採取應急處置措施的一種有效的手段。在世界上多個智慧城市指數排名中都位於前三位的城市國家新加坡,將智慧城市的目標定位於數字經濟、數字政府和數字社會等三個方面,包括智慧交通、智慧政務、智慧生活、智慧健康、智慧創業與商業等智慧方案。在2021年由國際咨詢公司伊甸策略中心(Eden Strategy Institute)組織的相關排名中,新加坡憑借運用智慧城市應對新冠肺炎疫情的出色表現,又一次在世界智慧城市排名中位列榜首。本文借鑒新加坡在智慧城市中推出的疫情防控服務平台TraceTogether的應用,結合我國城市防控新冠肺炎疫情的實踐,對在突發事件應對中建設與應用智慧城市的關鍵進行探討

⑸ 大數據能追蹤你的軌跡,知曉你是否去過新發地!

隨著新發地被爆出:在切割進口三文魚的案板中檢測到了新冠病毒,全國從放鬆又進入了緊張的狀態。

我們先看一下截至目前,北京的疫情情況:

從6月11號開始以來,累計確診922例,現有確診326例,從分布數據來看,主要聚集在豐台區、大興區和海淀區。

從新增趨勢來看,在北京的嚴防恐怖下,疫情在逐日好轉,此時想對北京說:堅持住!

但就在疫情發生之後,只要經過新發地的人員都收到一條簡訊:「經過全市大數據分析,您可能在5月30日(含)以後去過新發地批發市場……」。

這時,我們看到了大數據的作用,但大數據又是如何得知的呢?

首先什麼是基站?基站即公用移動通信基站,不僅是無線電台的一種,也是移動互聯的接入口,而我們的手機能實現移動互聯,就是來自各運營商基站的信號。

運營商基站定位是通過與基站的信號交互,推算用戶的行程或者位置軌跡,用於監測人員流動情況。

因此但凡去過新發地,或是途經新發地,只要在范圍內使用了手機,通過流量數據、GPS定位、發簡訊、打電話等等行為,觸發了附近基站的信令數據,在後台留存數據,從而追溯到使用者的行為,最終確認用戶軌跡。

這才有了大批人收到通知簡訊。

但如果真的只是自駕途經新發地,是不是相對安全?那麼如果與高德地圖、網路慧眼等做交叉驗證,從而對不同風險等級人員進一步篩查,效率是否會更高。

除了此次的新發地周圍人員的定位,在之前的武漢疫情中,網路遷徙數據、12306實名制售票數據都為疫情防控起到了至關重要的作用。

大數據+人工智慧助力精準防控疫情,利用大數據技術,實現了信息共享、查詢篩選。

從大數據在兩次疫情中起到的作用,我們可以知道,不僅能有效的縮減疫情的傳播與擴散,還能夠為疫情提供數據支持,從而分析與預測。

但大數據也存在著公認的弊端,即信息數據安全,因此,大數據還有一段路要走,但發展是必然的,而未來無論是人工智慧、物聯網還是雲計算的發展都離不開大數據的支持。

⑹ 根據本講大數據技術可以實現疫情防控的什麼分析

根據本講大數據技術可以實現疫情防控的什麼分析:快速、動態

2020年開年之際,新冠病毒洶涌而至,此次病毒傳播速度快,致病力強,隨著大數據時代的來臨,給疫情防控、應急救援帶來挑戰,也給大數據技術的應用帶來前所未有的機遇。大數據及其技術的應用,也為快速高效解決應急救援與應急保障提供新的思路和方法。

分析涉疫人員的軌跡信息。通過聯動大數據、電信運營商、互聯網公司、交通部門、公安等部門提供的數據信息,完成涉疫人員的地理位置確定與軌跡信息,

利用大數據技術分析出涉疫人員的流動軌跡。如通過手機信令等包含地理位置和時間戳信息的數據進行分析,繪制出病患的行動軌跡,形成涉疫人員的歷史時段軌跡信息圖,

利用大數據技術推斷出病患密切接觸者,疑似病患和相關接觸者的行動軌跡,並可以預測出高風險地區和潛在的高風險地區。

追溯傳染病源頭。根據病患的確診時間先後順序和密切接觸人員等信息定位時空碰撞點,通過大數據技術綜合分析涉疫人員的歷史時段軌跡信息圖,推斷出疾病傳播路徑,

⑺ 20號以後那些省份疫情嚴重

大數據疫情觀察(二):全國疫情高峰過了么?

騰景宏觀金融大勢研判

2022-12-23 17:23 · 來自北京

騰景宏觀快報

2022年12月23日

大數據疫情觀察(二):全國疫情高峰過了么?

—— 基於騰景AI高頻模擬和預測

騰景高頻和宏觀研究團隊

本期要點:

針對預測到底准不準,全國疫情是否已經見頂的問題,我們增加了28個城市的地鐵客運量日度數據進行輔助判斷。非網民樣本的缺失可能會導致預測結果有偏。

大數據不完美,應用大數據做宏觀經濟預測並非完美無缺,我們分析了谷歌流感趨勢何以失靈。原因可能包括:媒體對谷歌流感趨勢(GFT)的大幅報道導致人們的搜索行為發生了變化,用戶的搜索行為反過來也會影響GFT的預測結果。

當前全國疫情或尚未達峰,但是達峰進程可能會有所提前。藉助地鐵客運量數據進行輔助驗證,我們判斷北京、石家莊、武漢、重慶等城市已經度過疫情峰值,成都、天津、長沙、南京、西安等城市尚未達峰。

一、預測到底准不準?預期與現實相互驗證

在上期《大數據疫情觀察:中心城市率先迎來峰值》報告中,我們分析並給出了北京和河北部分城市疫情已經迎來「拐點」,成都、昆明等城市將陸續見頂的預測判斷。根據網路搜索指數數據,北京網路「發燒」搜索指數持續下降,「咳嗽」搜索指數後於「發燒」見頂,這基本上印證了我們模型的預測。但是,我們也注意到2022年12月17日(上周六)全國范圍內「發燒」指數見頂,這是否意味著全國疫情的見頂?如果這樣,這個數據與一些防疫專家的春節前後見頂的判斷就有所出入。也有專家認為全國疫情可能雖然尚未達峰,但是進程縮短了。

但根據位元組跳動的「巨量算數」,抖音「發燒」搜索指數於12月17日見頂,但頭條「發燒」搜索指數仍在震盪上行。在朋友圈廣為傳播的知乎「數據帝」的預測裡面,2022年12月20日前後大部分省市相繼達到感染高峰,那麼,很多研究者都想確認的是,站在2022年12月23日,全國范圍內的單日新增感染有沒有達峰?有人認為預測很准,和自己這些天在互聯網上對疫情的感知較為一致;有些人則認為不準,認為身邊的親戚朋友們都陽了,而預測進度條還不到一半,個人體感和預測結果有較大差異。

與此同時,我們注意到了在2022年12月16日前後,全國幾乎所有城市、省份「發燒」搜索指數迎來了「先揚後抑」的脈沖式增長,後續日度數據再也沒有高於16日當天的值。這意味著疫情最艱難的階段已經度過了么?通過對網路、頭條疫情病症搜索引擎數據進行數據挖掘和建模分析,可以為疫情未來趨勢研判提供重要參考。不過我們理解,為了定量評價疫情進展,還需要引入更多數據。

由於沒有權威數據作為參考,各類疫情的預測僅僅是基於直覺、推理或演繹的帶有參數的模型預測,預測准不準,缺乏客觀權威作為結果比較,所以很難客觀衡量預測是否准確,只能通過參與這件預測的所有觀眾和讀者通過微觀的數據,周圍疫情擴散程度去驗證預測結果,一個城市不同群體感染的先後,不同城市感染達峰的節奏,都會對預測是否准確有不一樣的理解。

模型有局限性,邏輯假設的適用性,缺乏權威數據作為驗證,難道就不需要預測了嗎?托馬斯·庫恩(Thomas Kuhn)和卡爾·波普爾(Karl Popper)就「科學哲學」這個概念展開了20世紀最具影響力的對峙。他們都以自己的方式深奧地從哲學的角度質疑科學的基本前提。庫恩的《科學革命的結構》(The Structure of Scientific Revolutions)指出,即使現有的範式所預測的結果在現實中存在反例,現有的科學家也不會認為其範式有問題;只有可替代現有範式的新科學範式出現,並且反例達到了一定的數量,現有科學範式才可能被證偽,科學革命才會發生。從批判的角度來看對預測過程的否定也是發現新預測方法的過程。

量子基金的喬治·索羅斯(George Soros)推崇的哲學家卡爾·波普爾(Karl Popper)最著名的觀點是科學是通過「可證偽性」(Falsifiability)進行的——人們無法證明假設是正確的,甚至無法通過歸納法獲得真理的證據,但如果假設是錯誤的,則可以反駁它。根據波普爾的觀點,只有可被經驗證偽的理論體系才應被賦予真正的科學地位。因此,波普爾提倡大膽假設,用證偽的方式去不斷試錯,不斷修正,而不是提出假說,然後到處找支持自己理論的根據。「證偽」也是索羅斯所一直推崇與實踐的思考方式。

二、地鐵客運量作為疫情達峰的重要輔助觀察指標

因此,我們從疫情出發,回到經濟,從多維度驗證疫情的峰值。地鐵客運量無疑是很好的觀察指標,一個有地鐵城市的客運量受若干因素影響:1、出行管制,2、出行意願,3、地鐵的便利程度。

從數據上來看,北京、上海作為全國地鐵保有量最高的兩個城市,也是日均客運量最高的兩個城市,地鐵數據較高的反映了疫情的高低,同時地鐵客運量的日度數據公布滯後1-3天,還算比較及時,從數據收集角度看,地鐵數據來自於物聯網設備自動採集,人工干預的影響較小,數據具有充分的客觀性,可以作為疫情的第二類主要觀察變數。

圖:上海地鐵客運量

▲數據來源:Wind、騰景AI經濟預測

上圖是2019年12月至今的上海地鐵客運量數據,比較明顯的是2020年初的武漢疫情,2022年4月的上海疫情,和2022年12月的全國疫情。由於地鐵客運量遵循周一至周五高,周六日低的原則,日度數據信息量有些冗餘,後續我們通過比較周度平均數據,可以過濾短期的日內數據波動。

圖:上海地鐵客運量(7日移動平均)

▲數據來源:Wind、騰景AI經濟預測

比較北京地鐵客運量,也可以看出2022年4月,上海地鐵停運7周左右,北京雖然沒有停運,但周度地鐵客運量均值從近三年日常的800萬降低到100萬以下。值得注意的是,2022年9月之後的北京地鐵客運量明顯低於上海,這一方面是疫情,另一方面也是北京地鐵需要全網查驗72小時核酸,11月24日進一步縮短到48小時,12月5日起這一政策被解除。

圖:北京地鐵客運量(7日移動平均)

▲數據來源:Wind、騰景AI經濟預測

圖:十大城市地鐵客運量7日移動平均,協同性高度一致

▲數據來源:Wind、騰景AI經濟預測

基於此數據,我們認為北京疫情高峰已過,但全國整體疫情高峰並非如網路搜索指數和頭條指數顯示的那樣已經見頂,而是處於快速發展期。我們建立了四階段數據模型,輔助驗證各城市是否達峰。如下圖所示,北京、武漢、重慶、沈陽、石家莊、蘭州、昆明地鐵客運量已經企穩回升,目前處於第四階段;成都、天津、長春、鄭州、廣州、廈門、深圳、西安、上海、南京等城市仍處於達峰進程中的第三階段。由於移動平均有可能會帶來數據滯後,後面,我們用真實數據做了測試。

圖:疫情擴散進程

▲數據來源:騰景AI經濟預測

圖:國內部分城市地鐵客運量(7日移動平均)

註:十大城市是指:北京、上海、廣州、成都、南京、武漢、西安、蘇州、鄭州、重慶,下同。

▲數據來源:Wind、騰景AI經濟預測

在以日度為單位的疫情進展中,如果當天地鐵出行數據出現回升,應該主要看兩個數據,第一是同比(例如本周一,相較於上周一的客流量),第二看環比(例如今天相較於昨天的客流量)。

根據日度數據,北京地鐵出行,無論是環比還是同比,均處於上行階段,這與見頂判斷一致,其他有可能見頂的是武漢、重慶、成都。而上海、廣州、南京、蘇州、西安等地鐵客運量仍在持續下滑,這表明疫情仍在達峰進程中。

圖:國內部分城市地鐵客運量

▲數據來源:Wind、騰景AI經濟預測

由於地鐵客運量同比數據(相較於上周本日的數據)下滑嚴重,我們判斷:上海、廣州、南京、西安、蘇州、鄭州等城市的疫情仍在達峰進程中,北京、武漢、重慶同比轉正,預計已度過疫情高峰。

圖:28個城市地鐵客運量及周度同比

▲數據來源:Wind、騰景AI經濟預測

三、預期如何與現實相互影響?

放開疫情管制後的經驗有很多,無論是疫情見頂的節奏,對消費,勞動參與率的影響,都有較多國家可以參考。這無疑給了我們一些預期,14億人口的放開和中等規模人口國家放開又有所區別。國內傳染病專家也在各類媒體上表示春節前後,明年一季度疫情達峰等等,釋放這樣的未來見頂信號。但是從北京和多數城市的感知中,疫情似乎見頂的早於我們的認知,那麼到底哪裡會出問題呢?

(一)政策指標失靈:古德哈特定律

當多數互聯網參與者都知道網路搜索指數能夠間接代表疫情的時候,它可能就不準了,在某種程度上,它就是古德哈特定律(Goodhart』s law)在疫情上的體現。古德哈特定律是出自於英國經濟學家查爾斯·古德哈特(Charles Goodhart)的說法,指的是:當一個政策變成目標,它將不再是一個好的政策。其中一種解釋為:一項社會指標或經濟指標,一旦成為一個用以指引宏觀政策制定的既定目標,那麼該指標就會喪失其原本具有的信息價值。

毫無疑問,在大多數人不知道「網路疫情指數」的重要性的情況下,它大概率還是有效的,內涵邏輯為搜索量大數據間接反映了大部分的居民自發的網路搜索行為,「發燒」搜索在一定程度上和陽性有症狀是一回事。但是,在官方媒體和自媒體都在報道的情況下,這一指標會引發更多的搜索,而這些搜索和疫情本身並沒有關系,而是互聯網流量帶來的效應。

(二)網民搜索行為的偏移可能造成數據污染

我們比較了石家莊、蘭州、北京、武漢、重慶、沈陽、昆明、成都、天津等城市的地鐵客運量,發現都經歷了政策放鬆而上行,疫情攀升客運量下行,疫情高峰度過再度上行這一數據變化模式。目前大部分城市仍處在疫情攀升客運量下行這一階段,全國疫情的頂峰目前並沒有到來,而網路指數給出的「發燒」搜索指數已經見頂,我們判斷12月16日及之後的網路「發燒」搜索指數可能出現了異常,核心邏輯是12月16日(上周六),全國所有城市都出現了一個攀升,隨後下降,這種能夠同一時間影響所有城市的因素大概率不是以一定規律傳播的病毒造成的,而是其他因素造成的數據「污染」。

(三)樣本缺失:60歲及以上老年人非網民群體

我們知道網路指數(Bai Index)、頭條指數(Toutiao Index)、微指數是基於海量網民行為數據進行數據挖掘分析的數據產品,因此非網民的行為數據自然被排除在研究樣本之外。

中國互聯網信息中心(CNNIC)2022年8月31日發布的第50次《中國互聯網路發展狀況統計報告》顯示,截至2022年6月,我國非網民規模為3.62億,這是一個不小的基數。從地區來看,我國非網民仍以農村地區為主,農村地區非網民佔比為41.2%。從年齡來看,60歲及以上老年群體是非網民的主要群體。據此可見,非網民地域上主要分布在農村地區,年齡上以60歲及以上老年群體為主。

這個基數不小的非網民群體檢索行為的缺失導致本來應該出現的檢索結果游離於樣本之外,導致「發燒」等病症搜索指數被低估。根據美國疾病控制與預防中心 (Centers for Disease Control and Prevention)的報告,患重症COVID-19的風險會隨著年齡、殘疾和基礎疾病的增加而增加。在後期的奧密克戎期間(2022年4月-6月),大多數院內死亡發生在年齡≥65歲的成年人(81.9%)和患有三種或更多種基礎疾病的人群(73.4%)中。

圖:世界各國家和地區每日確診的COVID-19病例(7日移動平均值)

註:由於檢測有限,確診病例數低於真實感染數,數據截至2022年12月21日

▲數據來源:約翰·霍普金斯大學CSSE COVID-19資料庫,ourworldindata.org、騰景AI經濟預測

圖:世界各地區每日確診的COVID-19病例(7 天滾動平均值)

註:由於檢測有限,確診病例數低於真實感染數,數據截至2022年12月21日

▲數據來源:約翰·霍普金斯大學CSSE COVID-19資料庫,ourworldindata.org、騰景AI經濟預測

(四)大數據不完美,谷歌流感趨勢為何失靈?

早在1980年,未來學家阿爾溫·托夫勒(Alvin Toffler)在《第三次浪潮》(The Third Wave)一書中,就提出了「大數據」(Big Data)的概念。自古至今,預測一直是人們十分期待的能力,而大數據預測則是數據最核心的應用,其邏輯是每一種非常規的變化事前一定有徵兆,每一件事情都有跡可循,如果找到了徵兆與變化之間的規律,就可以進行預測。

利用大數據方法和技術進行宏觀經濟研究和分析,在國際上已有先例。在大數據分析的視野中,它不僅僅是要搞清楚宏觀統計規律,更要弄清宏觀數據中的精細結構。基於研究的視角,大數據時代為宏觀經濟分析提供強大的支持,正在改變宏觀經濟研究範式。

各國央行等主流金融機構研發並採用即時預測模型以實時追蹤經濟狀態的變化,在被大量社會化信息淹沒前就找到可靠的信息源,從而動態地調整對經濟指標的預期。包括紐約聯儲的Nowcasting模型、WEI模型、亞特蘭大聯儲的GDPNow模型以及英格蘭銀行(BOE)的MIDAS模型等。

根據Didier Sornette教授的「龍王」理論,極端事件的發生有兩個條件:系統的一致性與協同性。當系統的一致性非常強時,黑天鵝式的極端事件容易發生。當系統的一致性和協同性同時加強時,會發生超越「黑天鵝」(Black swan theory)的更極端的「龍王」事件。

「黑天鵝」也好,「龍王」也好,都不是孤立的事件,而是一系列強烈關聯的事件,體現了正反饋的強大作用。什麼時候股市可以預測?關鍵就在於股市變化前後關聯的程度。

2008年穀歌推出的Google Flu Trends系統,其動機是能夠及早發現疾病活動並迅速做出反應可以減少季節性流感和大流行性流感的影響,通過分析收集到的大量Google搜索查詢,以揭示人群中是否存在流感樣疾病。這個邏輯和想法其實很簡單直觀——如果你生病了,你很可能會在搜索引擎上搜索以查找信息,比如如何治療。谷歌決定要跟蹤這些搜索,並使用這些數據來嘗試和預測流感流行,甚至在疾病控制中心(CDC)等醫療機構能夠做到之前。

2009年通過谷歌累積的海量搜索數據,「谷歌流感趨勢」成功預測了H1N1流感在美國境內的傳播,一戰成名。有報告指出,谷歌流感趨勢能夠在美國疾病控制和預防中心(CDC)報告流感爆發前10天預測區域性流感爆發。GFT這種預測能力顯然具有重大的社會意義,可以為整個社會提前控制傳染病疫情贏得先機。

於是谷歌在其網站上創建了一個奇特的方程式來計算出究竟有多少人感染了流感。簡單理解的數據邏輯是這樣的:人們的位置+谷歌上與流感相關的搜索查詢+一些非常聰明的演算法=美國流感患者的數量。

線性模型用於計算流感樣疾病(Influenza-like illness, ILI)就診的對數幾率和(ILI)相關搜索查詢的對數幾率:

P是醫生就診訪問的百分比,Q是在前面的步驟中計算的與ILI相關的查詢分數。β0是截距,β1是系數,ε而是誤差項。

谷歌流感趨勢已被證明不是一直准確的,尤其是在2011年至2013年期間,它高估了相對流感發病率,並且在2012年至2013年流感季節的一個時間段內預測就診次數是CDC記錄的兩倍。2013年《自然》雜志發表的一篇文章稱,谷歌流感趨勢將流感病例高估了約50%。

可以看到,應用大數據做宏觀經濟預測並非完美無缺。經濟學家、作家Tim Harford認為,「谷歌流感趨勢的失敗凸顯了不受約束的經驗主義的危險」。對GFT失敗的一種解釋是,新聞中充斥著關於2012年12月流感媒體恐慌情緒,而這些報道激起了健康人的互聯網搜索行為。

圖:谷歌流感趨勢ILI估計與CDC估計的比較

▲數據來源:Improving Google Flu Trends Estimates for the United States through Transformation, Leah J Martin, Biying Xu, Yutaka Yasui, 騰景AI經濟預測

2013年,谷歌調整了演算法,並回應稱出現偏差的「罪魁禍首」是媒體對GFT的大幅報道導致人們的搜索行為發生了變化。GFT也似乎沒有考慮引入專業的健康醫療數據以及專家經驗,同時也並未對用戶搜索數據進行「清洗」和「去噪」。谷歌在2011年之後推出「推薦相關搜索詞」,也就是我們今天很熟悉的搜索關聯詞模式。研究人員分析,這些調整有可能人為推高了一些搜索指數,並導致對流行發病率的高估。舉例來說,當用戶搜索「發燒」,谷歌會同時給出「喉嚨痛和發燒」、「如何治療喉嚨痛」等關聯推薦詞,這時用戶可能會出於好奇等原因進行點擊,造成用戶使用的關鍵詞並非用戶本意的現象,從而影響GFT搜索數據的准確性。用戶的搜索行為反過來也會影響GFT的預測結果。在充斥媒體報道和用戶主觀信息的搜索引擎的喧囂世界裡,也同樣存在「預測即干涉」悖論。國內搜索引擎指數上大概率也會出現類似的情況,這是我們結合GFT的經驗對預期差異給出的一種解釋。

圖:巨量算數「發燒」關聯搜索詞

▲數據來源:巨量算數、騰景AI經濟預測

(本文執筆:吳衛、趙宕涵;編輯:何峰峰)

參考文獻

[1] CNNIC:第50次《中國互聯網路發展狀況統計報告》

[2]https://www.cnnic.net.cn/NMediaFile/2022/0926/MAIN1664183425619U2MS433V3V.pdf

[3] Adjei S, Hong K, Molinari NM, et al. Mortality Risk Among Patients Hospitalized Primarily for COVID-19 During the Omicron and Delta Variant Pandemic Periods — United States, April 2020–June 2022. MMWR Morb Mortal Wkly Rep 2022;71:1182–1189. DOI:

[4]http://dx.doi.org/10.15585/mmwr.mm7137a4

[5]https://ourworldindata.org/grapher/daily-cases-covid-region?stackMode=relative

[6] Lazer, D., R. Kennedy, G. King, and A. Vespignani. 2014. 「The Parable of Google Flu: Traps in Big Data Analysis.」 Science 343 (6176) (March 14): 1203–1205.

更多重磅研究成果請關注公眾號「騰景AI經濟預測」。

搜索
天津感染高峰預測
天津死了多少新冠患者
全國疫情死亡總人數
中國疫情已死多少人
中央下達疫情最新政策
全國疫情最新消息

⑻ 大數據體現在哪些方面

1、疫情期間的大數據


就比如疫情期間我們所用的健康碼,其實也就是基於大數據,採集每位用戶的行動軌跡,然後自動生成綠碼或者紅碼。又比如說,在疫情爆發時,浙江通過使用交通流大數據技術,排查分析從疫情嚴重地區駛入的車輛,幫助提高疫情防控效率。另外,大數據也被廣泛應用到語音智能識別、智慧城市和信息安全、醫療、交通等方方面面。


2、業務流程優化


大數據還會更多的幫助業務流程的優化。我們可以通過利用社交媒體數據、網路搜索以及天氣預報等等去挖掘出大量的有價值的數據,其中大數據的應用最廣泛的就是供應鏈以及配送路線的優化。從這兩個方面,地理定位和無線電頻率的識別追蹤貨物和送貨車,利用實時交通路線數據制定更加優化的路線。


3、更了解用戶需求


大數據的應用目前在這領域是最廣為人知的。重點是如何應用大數據更好的了解客戶以及他們的愛好和行為。企業非常喜歡搜集社交方面的數據、瀏覽器的日誌、分析出文本和感測器的數據,為了更加全面的了解客戶。在一般情況下,建立出數據模型進行預測。舉一個比較簡單的例子就是通過大數據的應用,電信公司可以更好預測出流失的客戶,沃爾瑪則會更加精準的預測哪個產品會大賣,汽車保險行業會了解客戶的需求和駕駛水平,政府也能了解到選民的偏好。


4、提高醫療和研發


大數據分析應用的計算能力可以讓我們能夠在幾分鍾內就可以解碼整個DNA。並且讓我們可以制定出最新的治療方案。同時可以更好的去理解和預測疾病。就好像人們戴上智能手錶等可以產生的數據一樣,大數據同樣可以幫助病人對於病情進行更好的治療。大數據技術目前已經在醫院應用監視早產嬰兒和患病嬰兒的情況,通過記錄和分析嬰兒的心跳,醫生針對嬰兒的身體可能會出現不適症狀做出預測。這樣可以幫助醫生更好的救助嬰兒。


5、金融交易


大數據在金融行業主要是應用金融交易。高頻交易(HFT)是大數據應用比較多的領域。其中大數據演算法應用於交易決定。現在很多股權的交易都是利用大數據演算法進行,這些演算法現在越來越多的考慮了社交媒體和網站新聞來決定在未來幾秒內是買出還是賣出。


6、改善安全和執法


大數據現在已經廣泛應用到安全執法的過程當中。想必大家都知道美國安全局利用大數據進行恐怖主義打擊,甚至監控人們的日常生活。而企業則應用大數據技術進行防禦網路攻擊。警察應用大數據工具進行捕捉罪犯,信用卡公司應用大數據工具來檻車欺詐性交易。

⑼ 鍾南山稱疫情有望4月前結束!他是如何預測的

其實他這也是跟現如今的疫情狀況預計以及相關的數據。等問題進行預測的,例如根據現如今的疫情預測危重,正患者預測等等各種各樣的預測等等這一系列的數據研究表明在睡四月份之前可能會出現一個解決。 鍾南山院士2月11日在接受路透社采訪的時候就說,新冠狀病毒肺炎性新增感染病例已經在一些地區開始出現下滑了。而疫情有望會出現緩解的情況,而且他預計這個峰值可能會在二月中下旬的時候出現,並且在四月份之前可能會結束。而且隨著醫療人員物資和措施的推行,武漢的情況目前會出現一些改善,但是仍然處於一些困難時期,但是根據相關的研究發現和表明以及一些臨床數據可能二月中下旬會出現一個高峰值,但是在四月份還是有很大的可能性的。無論這個肺炎什麼時候結束,我們一定要嚴格的配合好政府的工作一定要加大控制力度。盡量不出門就是最大的貢獻。

閱讀全文

與疫情大數據預測分析相關的資料

熱點內容
安卓系統怎麼設置網路 瀏覽:707
win10下的文件類型選項 瀏覽:512
元數據修改什麼意思 瀏覽:555
掃描pdf轉word 瀏覽:914
行業協會如何查行業平均數據 瀏覽:545
什麼app能長期使用 瀏覽:617
哪個APP可以學相聲 瀏覽:347
程序使用代理 瀏覽:149
文件大小怎麼調 瀏覽:924
javadouble經度 瀏覽:354
英國頒布了哪些綱領性文件 瀏覽:929
文件隔行選擇是哪些鍵 瀏覽:395
股票的數據儲存在哪裡 瀏覽:172
微信雙機同時登陸 瀏覽:448
vbnet網頁源代碼 瀏覽:409
ibmwin10改win7 瀏覽:560
windows7搭建文件伺服器 瀏覽:358
丹麥為什麼不能用中文編程 瀏覽:872
abap自定義工具欄 瀏覽:44
計算機二級c語言程序修改怎麼做 瀏覽:440

友情鏈接