⑴ 兰州大学全球疫情预测系统,预测的数据可靠吗
任何事情的发展,都有事物本身具有的规律性。如果我们可以掌握足够多的真实数据,就可以建立起这个事物发展的模型。这样我们就可以依照模型的规律,对这件事的发展进行预测。或者是我们依据原有的数字模型,通过优化影响因素,来达到预测的目地。但是,预测系统并不是万能的,它只能为事物的发展提供一定的指导意见。
大数据的作用SIR传染病模型其实是一个很常见的传染病模型,这个模型的变形也是很多。其实对于传染病的预测,如果可以获得足够多、足够真实的数据,就可以对疫情的走向进行预测。这里面的难点就是大数据的准确性。
如果数据不够准确,即使模型参数优化的再好,预测系统预测的走势也是错误的。
各位,对于兰州大学全球疫情预测系统的准确性,您有什么不同看法,可以在评论区畅所欲言。
⑵ 泸州疫情高峰期是几号
泸州疫情高峰期是2022年12月23日。知名大数据研究专家针对疫情放开之后,首轮各城市感染高峰期大数据预测的分析。根据【城市数据库】最新数据分析:目前泸州感染达峰进度35%。中国疾病预防控制中心首席流行病专家吴尊友在《财经》年会上指出:今冬疫情可以概括为一峰三波。从12月中旬到1月中旬将是第一波疫情,第一波以城市为主,逐渐会上升起来。第二波是1月下旬到2月中旬,春节前的人员流动造成第二波疫情上升。第三波是2月下旬到3月中旬,春节后返岗返工。这三波疫情构成了今冬的新冠流行峰,持续大概三个月左右。吴尊友预测,今冬新冠感染率大约为10%到30%。
⑶ 天津放开后疫情高峰期什么时候过去
首页
夜城赋
精彩体育赛事专攻 数据免费分析 动态一手掌握
广告
全国第一波感染高峰时间表,看看你的家乡在哪时?
EMBA乐园
2023-01-05 21:30
+订阅
随着疫情的放开,根据大数据模型预测感染高峰的时间表如下:仅供参考!
1、北京,人口2189万,第一波感染高峰到达日2022年12月16日,高峰结束日2023年1月22日,达峰进度87%(见达峰进度解释)
2、深圳,人口1749万,第一波感染高峰到达日2022年12月23日,高峰结束日2023年1月16日,达峰进度20%
展开剩余92%
你反对春节期间禁止燃放烟花吗?
1.3w人表态
不反对
反对
今冬明春新冠和流感叠加流行
广告
世界杯足球赛事专攻,高清免费在线看!
广告
推荐阅读
突发噩耗!60岁知名主持人不幸病逝,因感染新冠致病情恶化
西皮娱乐 2022.12.29 607.7万+
刚刚!疾控专家终于说实话了,可能80%-90%人都会感染!
冒险旅途 昨天00:14 54.6万+
全国第一波感染高峰时间表,看看你的家乡在哪时?
教育天天见 2022.12.26 2.4万
张文宏:第二波感染高峰期预估出来了,大家不要再盲目乐观了!
开心的爷三 19小时前 14.6万+
全国第一波感染高峰时间表,看看你的家乡在哪时?
东方之心教... 2022.12.29 1.5万
终于有好消息!专家发现新冠致命弱点:若成功人类将不用再害怕了
浩哥历史人... 2022.12.24 201.6万+
不管阳没阳,建议家人多吃这“2白”,滋润养肺,身体恢复快
格式娱乐 24小时前 1.7万
中国自1月8日起优化移民管理政策措施,是否按计划进行所有的准备工作?外交部回应
北京商报 2小时前 212
全国第一波感染高峰时间表,看看你的家乡在哪时?
思修考试法... 2022.12.28 4370
全国第一个恢复的城市!!已经出现了!!
聊聊小学家... 2022.12.29 3.2万
23年养老金上调方案已敲定,满20年工龄的人有福了,收入拉开差距
简单过生活 2022.12.16 100.9万+
WMO秘书长:三重拉尼娜仅带来暂时有限的冷却影响!
大西北消息... 1小时前 207
奥密克戎被专家严重低估,强烈请求再次封控,核酸检测回归国有
孙爱华 19小时前 4.7万
一路走好!又有3位明星因疫情去世,最小的只有40岁
养殖草食动... 2022.12.27 342.4万+
郭晶晶病情终究是瞒不住了,难怪霍启刚那么疼爱她,真相令人心疼
动漫精灵儿 昨天07:51 31.5万+
第二波感染高峰什么时候来?会有多少人感染?专家最新研判
光明网 3天前 66.6万+
山东传来不太好的消息,第二波感染高峰马上到,第三波也不远了!
软萌说本地 19小时前 7.6万
多人“阳”后突然倒地,紧急手术!医生紧急提醒:都有一个共同点→
昆明信息港 8小时前 10.3万+
春运回家,这类消毒液不能带上高铁!
洞庭湖边那... 10小时前 51
强奸之后,又自愿发生6次性关系,那第一次能定强奸吗?
地铁生活记... 2022.12.22 73.1万+
70岁的王刚生活不易,妻子一月要花上百万,60岁老来有喜,太难了
科技小躁 6天前 43.1万+
钟南山提出大胆设想:新冠可能与人类长期共存,疫苗可能要定期打
小旋时尚 2022.12.26 197.8万+
杨幂刘恺威实锤复婚!刘恺威直言:我们更希望小檽米有个安稳的家
夕盼运动 5天前 138.2万+
张文宏等人反驳钟南山观点——新冠病毒已变无可变?
财圈社 前天07:09 63.6万+
【关注】乡村美百姓富!荣昌去年实施19个“以工代赈”项目
川渝本地消... 2小时前 73
转阴以后,建议中老年:千万别省钱,多吃这4样,营养丰富好得快
豆皮爱美食 5天前 72.5万+
李晨升级做爸爸!夫妻俩散步有说有笑,孕肚挡不住好事将近!
乐翻车娱乐 2022.12.20 333.6万+
【人社日课·说卡】1月6日 社保卡更换,能保留以前的银行账号吗?
大西北消息... 2小时前 25
全国第一波感染高峰时间表,看看你的家乡在哪时?
米先生教育 前天14:03 8490
第二波感染高峰什么时候来?会有多少人感染?专家最新研判→
东南西北那... 昨天21:05 177
自然资源部办公厅 国家林业和草原局办公室关于印发《自然资源调查监测成果管理办法(试行)》的通知
中部城市生... 6小时前 102
一个真正感染新型冠状病毒离世的讣告!
妙笔成章 22小时前 6.4万
头像
我想说...
+1
推荐搜索
各地感染期高峰图
全国感染高峰进度表查
全国各城市感染高峰分
全国各城市感染高峰进
全国各城市感染高峰在
全国各城市感染高峰进
网站地图
新闻财经体育娱乐军事图库汽车房产时尚短视频历史科技
用户反馈
合作
隐私政策
Copyright © 2023 Sohu All Rights Reserved
搜狐公司 版权所有
⑷ 疫情开始时新加坡如何利用大数据分析和控制疫情传播
随着信息和通信技术(Information and Communication Technology–ICT)的快速发展和广泛应用,“智慧城市(Smart City)”已经成为全球各国城市应对人口、环境、资源和管理等挑战的一种创新方案。尤其是在应对自然灾害、事故灾难、公共卫生事件和社会安全事件等突发事件的过程中,智慧城市已经成为采取应急处置措施的一种有效的手段。在世界上多个智慧城市指数排名中都位于前三位的城市国家新加坡,将智慧城市的目标定位于数字经济、数字政府和数字社会等三个方面,包括智慧交通、智慧政务、智慧生活、智慧健康、智慧创业与商业等智慧方案。在2021年由国际咨询公司伊甸策略中心(Eden Strategy Institute)组织的相关排名中,新加坡凭借运用智慧城市应对新冠肺炎疫情的出色表现,又一次在世界智慧城市排名中位列榜首。本文借鉴新加坡在智慧城市中推出的疫情防控服务平台TraceTogether的应用,结合我国城市防控新冠肺炎疫情的实践,对在突发事件应对中建设与应用智慧城市的关键进行探讨
⑸ 大数据能追踪你的轨迹,知晓你是否去过新发地!
随着新发地被爆出:在切割进口三文鱼的案板中检测到了新冠病毒,全国从放松又进入了紧张的状态。
我们先看一下截至目前,北京的疫情情况:
从6月11号开始以来,累计确诊922例,现有确诊326例,从分布数据来看,主要聚集在丰台区、大兴区和海淀区。
从新增趋势来看,在北京的严防恐怖下,疫情在逐日好转,此时想对北京说:坚持住!
但就在疫情发生之后,只要经过新发地的人员都收到一条短信:“经过全市大数据分析,您可能在5月30日(含)以后去过新发地批发市场……”。
这时,我们看到了大数据的作用,但大数据又是如何得知的呢?
首先什么是基站?基站即公用移动通信基站,不仅是无线电台的一种,也是移动互联的接入口,而我们的手机能实现移动互联,就是来自各运营商基站的信号。
运营商基站定位是通过与基站的信号交互,推算用户的行程或者位置轨迹,用于监测人员流动情况。
因此但凡去过新发地,或是途经新发地,只要在范围内使用了手机,通过流量数据、GPS定位、发短信、打电话等等行为,触发了附近基站的信令数据,在后台留存数据,从而追溯到使用者的行为,最终确认用户轨迹。
这才有了大批人收到通知短信。
但如果真的只是自驾途经新发地,是不是相对安全?那么如果与高德地图、网络慧眼等做交叉验证,从而对不同风险等级人员进一步筛查,效率是否会更高。
除了此次的新发地周围人员的定位,在之前的武汉疫情中,网络迁徙数据、12306实名制售票数据都为疫情防控起到了至关重要的作用。
大数据+人工智能助力精准防控疫情,利用大数据技术,实现了信息共享、查询筛选。
从大数据在两次疫情中起到的作用,我们可以知道,不仅能有效的缩减疫情的传播与扩散,还能够为疫情提供数据支持,从而分析与预测。
但大数据也存在着公认的弊端,即信息数据安全,因此,大数据还有一段路要走,但发展是必然的,而未来无论是人工智能、物联网还是云计算的发展都离不开大数据的支持。
⑹ 根据本讲大数据技术可以实现疫情防控的什么分析
根据本讲大数据技术可以实现疫情防控的什么分析:快速、动态
2020年开年之际,新冠病毒汹涌而至,此次病毒传播速度快,致病力强,随着大数据时代的来临,给疫情防控、应急救援带来挑战,也给大数据技术的应用带来前所未有的机遇。大数据及其技术的应用,也为快速高效解决应急救援与应急保障提供新的思路和方法。
分析涉疫人员的轨迹信息。通过联动大数据、电信运营商、互联网公司、交通部门、公安等部门提供的数据信息,完成涉疫人员的地理位置确定与轨迹信息,
利用大数据技术分析出涉疫人员的流动轨迹。如通过手机信令等包含地理位置和时间戳信息的数据进行分析,绘制出病患的行动轨迹,形成涉疫人员的历史时段轨迹信息图,
利用大数据技术推断出病患密切接触者,疑似病患和相关接触者的行动轨迹,并可以预测出高风险地区和潜在的高风险地区。
追溯传染病源头。根据病患的确诊时间先后顺序和密切接触人员等信息定位时空碰撞点,通过大数据技术综合分析涉疫人员的历史时段轨迹信息图,推断出疾病传播路径,
⑺ 20号以后那些省份疫情严重
大数据疫情观察(二):全国疫情高峰过了么?
腾景宏观金融大势研判
2022-12-23 17:23 · 来自北京
腾景宏观快报
2022年12月23日
大数据疫情观察(二):全国疫情高峰过了么?
—— 基于腾景AI高频模拟和预测
腾景高频和宏观研究团队
本期要点:
针对预测到底准不准,全国疫情是否已经见顶的问题,我们增加了28个城市的地铁客运量日度数据进行辅助判断。非网民样本的缺失可能会导致预测结果有偏。
大数据不完美,应用大数据做宏观经济预测并非完美无缺,我们分析了谷歌流感趋势何以失灵。原因可能包括:媒体对谷歌流感趋势(GFT)的大幅报道导致人们的搜索行为发生了变化,用户的搜索行为反过来也会影响GFT的预测结果。
当前全国疫情或尚未达峰,但是达峰进程可能会有所提前。借助地铁客运量数据进行辅助验证,我们判断北京、石家庄、武汉、重庆等城市已经度过疫情峰值,成都、天津、长沙、南京、西安等城市尚未达峰。
一、预测到底准不准?预期与现实相互验证
在上期《大数据疫情观察:中心城市率先迎来峰值》报告中,我们分析并给出了北京和河北部分城市疫情已经迎来“拐点”,成都、昆明等城市将陆续见顶的预测判断。根据网络搜索指数数据,北京网络“发烧”搜索指数持续下降,“咳嗽”搜索指数后于“发烧”见顶,这基本上印证了我们模型的预测。但是,我们也注意到2022年12月17日(上周六)全国范围内“发烧”指数见顶,这是否意味着全国疫情的见顶?如果这样,这个数据与一些防疫专家的春节前后见顶的判断就有所出入。也有专家认为全国疫情可能虽然尚未达峰,但是进程缩短了。
但根据字节跳动的“巨量算数”,抖音“发烧”搜索指数于12月17日见顶,但头条“发烧”搜索指数仍在震荡上行。在朋友圈广为传播的知乎“数据帝”的预测里面,2022年12月20日前后大部分省市相继达到感染高峰,那么,很多研究者都想确认的是,站在2022年12月23日,全国范围内的单日新增感染有没有达峰?有人认为预测很准,和自己这些天在互联网上对疫情的感知较为一致;有些人则认为不准,认为身边的亲戚朋友们都阳了,而预测进度条还不到一半,个人体感和预测结果有较大差异。
与此同时,我们注意到了在2022年12月16日前后,全国几乎所有城市、省份“发烧”搜索指数迎来了“先扬后抑”的脉冲式增长,后续日度数据再也没有高于16日当天的值。这意味着疫情最艰难的阶段已经度过了么?通过对网络、头条疫情病症搜索引擎数据进行数据挖掘和建模分析,可以为疫情未来趋势研判提供重要参考。不过我们理解,为了定量评价疫情进展,还需要引入更多数据。
由于没有权威数据作为参考,各类疫情的预测仅仅是基于直觉、推理或演绎的带有参数的模型预测,预测准不准,缺乏客观权威作为结果比较,所以很难客观衡量预测是否准确,只能通过参与这件预测的所有观众和读者通过微观的数据,周围疫情扩散程度去验证预测结果,一个城市不同群体感染的先后,不同城市感染达峰的节奏,都会对预测是否准确有不一样的理解。
模型有局限性,逻辑假设的适用性,缺乏权威数据作为验证,难道就不需要预测了吗?托马斯·库恩(Thomas Kuhn)和卡尔·波普尔(Karl Popper)就“科学哲学”这个概念展开了20世纪最具影响力的对峙。他们都以自己的方式深奥地从哲学的角度质疑科学的基本前提。库恩的《科学革命的结构》(The Structure of Scientific Revolutions)指出,即使现有的范式所预测的结果在现实中存在反例,现有的科学家也不会认为其范式有问题;只有可替代现有范式的新科学范式出现,并且反例达到了一定的数量,现有科学范式才可能被证伪,科学革命才会发生。从批判的角度来看对预测过程的否定也是发现新预测方法的过程。
量子基金的乔治·索罗斯(George Soros)推崇的哲学家卡尔·波普尔(Karl Popper)最著名的观点是科学是通过“可证伪性”(Falsifiability)进行的——人们无法证明假设是正确的,甚至无法通过归纳法获得真理的证据,但如果假设是错误的,则可以反驳它。根据波普尔的观点,只有可被经验证伪的理论体系才应被赋予真正的科学地位。因此,波普尔提倡大胆假设,用证伪的方式去不断试错,不断修正,而不是提出假说,然后到处找支持自己理论的根据。“证伪”也是索罗斯所一直推崇与实践的思考方式。
二、地铁客运量作为疫情达峰的重要辅助观察指标
因此,我们从疫情出发,回到经济,从多维度验证疫情的峰值。地铁客运量无疑是很好的观察指标,一个有地铁城市的客运量受若干因素影响:1、出行管制,2、出行意愿,3、地铁的便利程度。
从数据上来看,北京、上海作为全国地铁保有量最高的两个城市,也是日均客运量最高的两个城市,地铁数据较高的反映了疫情的高低,同时地铁客运量的日度数据公布滞后1-3天,还算比较及时,从数据收集角度看,地铁数据来自于物联网设备自动采集,人工干预的影响较小,数据具有充分的客观性,可以作为疫情的第二类主要观察变量。
图:上海地铁客运量
▲数据来源:Wind、腾景AI经济预测
上图是2019年12月至今的上海地铁客运量数据,比较明显的是2020年初的武汉疫情,2022年4月的上海疫情,和2022年12月的全国疫情。由于地铁客运量遵循周一至周五高,周六日低的原则,日度数据信息量有些冗余,后续我们通过比较周度平均数据,可以过滤短期的日内数据波动。
图:上海地铁客运量(7日移动平均)
▲数据来源:Wind、腾景AI经济预测
比较北京地铁客运量,也可以看出2022年4月,上海地铁停运7周左右,北京虽然没有停运,但周度地铁客运量均值从近三年日常的800万降低到100万以下。值得注意的是,2022年9月之后的北京地铁客运量明显低于上海,这一方面是疫情,另一方面也是北京地铁需要全网查验72小时核酸,11月24日进一步缩短到48小时,12月5日起这一政策被解除。
图:北京地铁客运量(7日移动平均)
▲数据来源:Wind、腾景AI经济预测
图:十大城市地铁客运量7日移动平均,协同性高度一致
▲数据来源:Wind、腾景AI经济预测
基于此数据,我们认为北京疫情高峰已过,但全国整体疫情高峰并非如网络搜索指数和头条指数显示的那样已经见顶,而是处于快速发展期。我们建立了四阶段数据模型,辅助验证各城市是否达峰。如下图所示,北京、武汉、重庆、沈阳、石家庄、兰州、昆明地铁客运量已经企稳回升,目前处于第四阶段;成都、天津、长春、郑州、广州、厦门、深圳、西安、上海、南京等城市仍处于达峰进程中的第三阶段。由于移动平均有可能会带来数据滞后,后面,我们用真实数据做了测试。
图:疫情扩散进程
▲数据来源:腾景AI经济预测
图:国内部分城市地铁客运量(7日移动平均)
注:十大城市是指:北京、上海、广州、成都、南京、武汉、西安、苏州、郑州、重庆,下同。
▲数据来源:Wind、腾景AI经济预测
在以日度为单位的疫情进展中,如果当天地铁出行数据出现回升,应该主要看两个数据,第一是同比(例如本周一,相较于上周一的客流量),第二看环比(例如今天相较于昨天的客流量)。
根据日度数据,北京地铁出行,无论是环比还是同比,均处于上行阶段,这与见顶判断一致,其他有可能见顶的是武汉、重庆、成都。而上海、广州、南京、苏州、西安等地铁客运量仍在持续下滑,这表明疫情仍在达峰进程中。
图:国内部分城市地铁客运量
▲数据来源:Wind、腾景AI经济预测
由于地铁客运量同比数据(相较于上周本日的数据)下滑严重,我们判断:上海、广州、南京、西安、苏州、郑州等城市的疫情仍在达峰进程中,北京、武汉、重庆同比转正,预计已度过疫情高峰。
图:28个城市地铁客运量及周度同比
▲数据来源:Wind、腾景AI经济预测
三、预期如何与现实相互影响?
放开疫情管制后的经验有很多,无论是疫情见顶的节奏,对消费,劳动参与率的影响,都有较多国家可以参考。这无疑给了我们一些预期,14亿人口的放开和中等规模人口国家放开又有所区别。国内传染病专家也在各类媒体上表示春节前后,明年一季度疫情达峰等等,释放这样的未来见顶信号。但是从北京和多数城市的感知中,疫情似乎见顶的早于我们的认知,那么到底哪里会出问题呢?
(一)政策指标失灵:古德哈特定律
当多数互联网参与者都知道网络搜索指数能够间接代表疫情的时候,它可能就不准了,在某种程度上,它就是古德哈特定律(Goodhart’s law)在疫情上的体现。古德哈特定律是出自于英国经济学家查尔斯·古德哈特(Charles Goodhart)的说法,指的是:当一个政策变成目标,它将不再是一个好的政策。其中一种解释为:一项社会指标或经济指标,一旦成为一个用以指引宏观政策制定的既定目标,那么该指标就会丧失其原本具有的信息价值。
毫无疑问,在大多数人不知道“网络疫情指数”的重要性的情况下,它大概率还是有效的,内涵逻辑为搜索量大数据间接反映了大部分的居民自发的网络搜索行为,“发烧”搜索在一定程度上和阳性有症状是一回事。但是,在官方媒体和自媒体都在报道的情况下,这一指标会引发更多的搜索,而这些搜索和疫情本身并没有关系,而是互联网流量带来的效应。
(二)网民搜索行为的偏移可能造成数据污染
我们比较了石家庄、兰州、北京、武汉、重庆、沈阳、昆明、成都、天津等城市的地铁客运量,发现都经历了政策放松而上行,疫情攀升客运量下行,疫情高峰度过再度上行这一数据变化模式。目前大部分城市仍处在疫情攀升客运量下行这一阶段,全国疫情的顶峰目前并没有到来,而网络指数给出的“发烧”搜索指数已经见顶,我们判断12月16日及之后的网络“发烧”搜索指数可能出现了异常,核心逻辑是12月16日(上周六),全国所有城市都出现了一个攀升,随后下降,这种能够同一时间影响所有城市的因素大概率不是以一定规律传播的病毒造成的,而是其他因素造成的数据“污染”。
(三)样本缺失:60岁及以上老年人非网民群体
我们知道网络指数(Bai Index)、头条指数(Toutiao Index)、微指数是基于海量网民行为数据进行数据挖掘分析的数据产品,因此非网民的行为数据自然被排除在研究样本之外。
中国互联网信息中心(CNNIC)2022年8月31日发布的第50次《中国互联网络发展状况统计报告》显示,截至2022年6月,我国非网民规模为3.62亿,这是一个不小的基数。从地区来看,我国非网民仍以农村地区为主,农村地区非网民占比为41.2%。从年龄来看,60岁及以上老年群体是非网民的主要群体。据此可见,非网民地域上主要分布在农村地区,年龄上以60岁及以上老年群体为主。
这个基数不小的非网民群体检索行为的缺失导致本来应该出现的检索结果游离于样本之外,导致“发烧”等病症搜索指数被低估。根据美国疾病控制与预防中心 (Centers for Disease Control and Prevention)的报告,患重症COVID-19的风险会随着年龄、残疾和基础疾病的增加而增加。在后期的奥密克戎期间(2022年4月-6月),大多数院内死亡发生在年龄≥65岁的成年人(81.9%)和患有三种或更多种基础疾病的人群(73.4%)中。
图:世界各国家和地区每日确诊的COVID-19病例(7日移动平均值)
注:由于检测有限,确诊病例数低于真实感染数,数据截至2022年12月21日
▲数据来源:约翰·霍普金斯大学CSSE COVID-19数据库,ourworldindata.org、腾景AI经济预测
图:世界各地区每日确诊的COVID-19病例(7 天滚动平均值)
注:由于检测有限,确诊病例数低于真实感染数,数据截至2022年12月21日
▲数据来源:约翰·霍普金斯大学CSSE COVID-19数据库,ourworldindata.org、腾景AI经济预测
(四)大数据不完美,谷歌流感趋势为何失灵?
早在1980年,未来学家阿尔温·托夫勒(Alvin Toffler)在《第三次浪潮》(The Third Wave)一书中,就提出了“大数据”(Big Data)的概念。自古至今,预测一直是人们十分期待的能力,而大数据预测则是数据最核心的应用,其逻辑是每一种非常规的变化事前一定有征兆,每一件事情都有迹可循,如果找到了征兆与变化之间的规律,就可以进行预测。
利用大数据方法和技术进行宏观经济研究和分析,在国际上已有先例。在大数据分析的视野中,它不仅仅是要搞清楚宏观统计规律,更要弄清宏观数据中的精细结构。基于研究的视角,大数据时代为宏观经济分析提供强大的支持,正在改变宏观经济研究范式。
各国央行等主流金融机构研发并采用即时预测模型以实时追踪经济状态的变化,在被大量社会化信息淹没前就找到可靠的信息源,从而动态地调整对经济指标的预期。包括纽约联储的Nowcasting模型、WEI模型、亚特兰大联储的GDPNow模型以及英格兰银行(BOE)的MIDAS模型等。
根据Didier Sornette教授的“龙王”理论,极端事件的发生有两个条件:系统的一致性与协同性。当系统的一致性非常强时,黑天鹅式的极端事件容易发生。当系统的一致性和协同性同时加强时,会发生超越“黑天鹅”(Black swan theory)的更极端的“龙王”事件。
“黑天鹅”也好,“龙王”也好,都不是孤立的事件,而是一系列强烈关联的事件,体现了正反馈的强大作用。什么时候股市可以预测?关键就在于股市变化前后关联的程度。
2008年谷歌推出的Google Flu Trends系统,其动机是能够及早发现疾病活动并迅速做出反应可以减少季节性流感和大流行性流感的影响,通过分析收集到的大量Google搜索查询,以揭示人群中是否存在流感样疾病。这个逻辑和想法其实很简单直观——如果你生病了,你很可能会在搜索引擎上搜索以查找信息,比如如何治疗。谷歌决定要跟踪这些搜索,并使用这些数据来尝试和预测流感流行,甚至在疾病控制中心(CDC)等医疗机构能够做到之前。
2009年通过谷歌累积的海量搜索数据,“谷歌流感趋势”成功预测了H1N1流感在美国境内的传播,一战成名。有报告指出,谷歌流感趋势能够在美国疾病控制和预防中心(CDC)报告流感爆发前10天预测区域性流感爆发。GFT这种预测能力显然具有重大的社会意义,可以为整个社会提前控制传染病疫情赢得先机。
于是谷歌在其网站上创建了一个奇特的方程式来计算出究竟有多少人感染了流感。简单理解的数据逻辑是这样的:人们的位置+谷歌上与流感相关的搜索查询+一些非常聪明的算法=美国流感患者的数量。
线性模型用于计算流感样疾病(Influenza-like illness, ILI)就诊的对数几率和(ILI)相关搜索查询的对数几率:
P是医生就诊访问的百分比,Q是在前面的步骤中计算的与ILI相关的查询分数。β0是截距,β1是系数,ε而是误差项。
谷歌流感趋势已被证明不是一直准确的,尤其是在2011年至2013年期间,它高估了相对流感发病率,并且在2012年至2013年流感季节的一个时间段内预测就诊次数是CDC记录的两倍。2013年《自然》杂志发表的一篇文章称,谷歌流感趋势将流感病例高估了约50%。
可以看到,应用大数据做宏观经济预测并非完美无缺。经济学家、作家Tim Harford认为,“谷歌流感趋势的失败凸显了不受约束的经验主义的危险”。对GFT失败的一种解释是,新闻中充斥着关于2012年12月流感媒体恐慌情绪,而这些报道激起了健康人的互联网搜索行为。
图:谷歌流感趋势ILI估计与CDC估计的比较
▲数据来源:Improving Google Flu Trends Estimates for the United States through Transformation, Leah J Martin, Biying Xu, Yutaka Yasui, 腾景AI经济预测
2013年,谷歌调整了算法,并回应称出现偏差的“罪魁祸首”是媒体对GFT的大幅报道导致人们的搜索行为发生了变化。GFT也似乎没有考虑引入专业的健康医疗数据以及专家经验,同时也并未对用户搜索数据进行“清洗”和“去噪”。谷歌在2011年之后推出“推荐相关搜索词”,也就是我们今天很熟悉的搜索关联词模式。研究人员分析,这些调整有可能人为推高了一些搜索指数,并导致对流行发病率的高估。举例来说,当用户搜索“发烧”,谷歌会同时给出“喉咙痛和发烧”、“如何治疗喉咙痛”等关联推荐词,这时用户可能会出于好奇等原因进行点击,造成用户使用的关键词并非用户本意的现象,从而影响GFT搜索数据的准确性。用户的搜索行为反过来也会影响GFT的预测结果。在充斥媒体报道和用户主观信息的搜索引擎的喧嚣世界里,也同样存在“预测即干涉”悖论。国内搜索引擎指数上大概率也会出现类似的情况,这是我们结合GFT的经验对预期差异给出的一种解释。
图:巨量算数“发烧”关联搜索词
▲数据来源:巨量算数、腾景AI经济预测
(本文执笔:吴卫、赵宕涵;编辑:何峰峰)
参考文献
[1] CNNIC:第50次《中国互联网络发展状况统计报告》
[2]https://www.cnnic.net.cn/NMediaFile/2022/0926/MAIN1664183425619U2MS433V3V.pdf
[3] Adjei S, Hong K, Molinari NM, et al. Mortality Risk Among Patients Hospitalized Primarily for COVID-19 During the Omicron and Delta Variant Pandemic Periods — United States, April 2020–June 2022. MMWR Morb Mortal Wkly Rep 2022;71:1182–1189. DOI:
[4]http://dx.doi.org/10.15585/mmwr.mm7137a4
[5]https://ourworldindata.org/grapher/daily-cases-covid-region?stackMode=relative
[6] Lazer, D., R. Kennedy, G. King, and A. Vespignani. 2014. “The Parable of Google Flu: Traps in Big Data Analysis.” Science 343 (6176) (March 14): 1203–1205.
更多重磅研究成果请关注公众号“腾景AI经济预测”。
搜索
天津感染高峰预测
天津死了多少新冠患者
全国疫情死亡总人数
中国疫情已死多少人
中央下达疫情最新政策
全国疫情最新消息
⑻ 大数据体现在哪些方面
1、疫情期间的大数据
就比如疫情期间我们所用的健康码,其实也就是基于大数据,采集每位用户的行动轨迹,然后自动生成绿码或者红码。又比如说,在疫情爆发时,浙江通过使用交通流大数据技术,排查分析从疫情严重地区驶入的车辆,帮助提高疫情防控效率。另外,大数据也被广泛应用到语音智能识别、智慧城市和信息安全、医疗、交通等方方面面。
2、业务流程优化
大数据还会更多的帮助业务流程的优化。我们可以通过利用社交媒体数据、网络搜索以及天气预报等等去挖掘出大量的有价值的数据,其中大数据的应用最广泛的就是供应链以及配送路线的优化。从这两个方面,地理定位和无线电频率的识别追踪货物和送货车,利用实时交通路线数据制定更加优化的路线。
3、更了解用户需求
大数据的应用目前在这领域是最广为人知的。重点是如何应用大数据更好的了解客户以及他们的爱好和行为。企业非常喜欢搜集社交方面的数据、浏览器的日志、分析出文本和传感器的数据,为了更加全面的了解客户。在一般情况下,建立出数据模型进行预测。举一个比较简单的例子就是通过大数据的应用,电信公司可以更好预测出流失的客户,沃尔玛则会更加精准的预测哪个产品会大卖,汽车保险行业会了解客户的需求和驾驶水平,政府也能了解到选民的偏好。
4、提高医疗和研发
大数据分析应用的计算能力可以让我们能够在几分钟内就可以解码整个DNA。并且让我们可以制定出最新的治疗方案。同时可以更好的去理解和预测疾病。就好像人们戴上智能手表等可以产生的数据一样,大数据同样可以帮助病人对于病情进行更好的治疗。大数据技术目前已经在医院应用监视早产婴儿和患病婴儿的情况,通过记录和分析婴儿的心跳,医生针对婴儿的身体可能会出现不适症状做出预测。这样可以帮助医生更好的救助婴儿。
5、金融交易
大数据在金融行业主要是应用金融交易。高频交易(HFT)是大数据应用比较多的领域。其中大数据算法应用于交易决定。现在很多股权的交易都是利用大数据算法进行,这些算法现在越来越多的考虑了社交媒体和网站新闻来决定在未来几秒内是买出还是卖出。
6、改善安全和执法
大数据现在已经广泛应用到安全执法的过程当中。想必大家都知道美国安全局利用大数据进行恐怖主义打击,甚至监控人们的日常生活。而企业则应用大数据技术进行防御网络攻击。警察应用大数据工具进行捕捉罪犯,信用卡公司应用大数据工具来槛车欺诈性交易。
⑼ 钟南山称疫情有望4月前结束!他是如何预测的
其实他这也是跟现如今的疫情状况预计以及相关的数据。等问题进行预测的,例如根据现如今的疫情预测危重,正患者预测等等各种各样的预测等等这一系列的数据研究表明在睡四月份之前可能会出现一个解决。 钟南山院士2月11日在接受路透社采访的时候就说,新冠状病毒肺炎性新增感染病例已经在一些地区开始出现下滑了。而疫情有望会出现缓解的情况,而且他预计这个峰值可能会在二月中下旬的时候出现,并且在四月份之前可能会结束。而且随着医疗人员物资和措施的推行,武汉的情况目前会出现一些改善,但是仍然处于一些困难时期,但是根据相关的研究发现和表明以及一些临床数据可能二月中下旬会出现一个高峰值,但是在四月份还是有很大的可能性的。无论这个肺炎什么时候结束,我们一定要严格的配合好政府的工作一定要加大控制力度。尽量不出门就是最大的贡献。