导航:首页 > 网络数据 > 大数据背景下统计学的发展

大数据背景下统计学的发展

发布时间:2023-01-02 12:17:45

『壹』 大数据来了 给政府统计带来了机遇与挑战

大数据来了 给政府统计带来了机遇与挑战

对于政府统计机构来说,没有什么比数据更重要的了。我们研究统计分类标准、统计调查方法、统计数据采集方式、统计数据加工处理方法、统计数据评估技术,都是为了获取真实准确、完整及时、代表性强、分类科学、经济适用的统计数据。

大数据时代的到来,既给政府统计带来重大发展机遇,也带来严峻挑战。

一、大数据在政府统计中的应用

国家统计局高度重视大数据在政府统计中的应用。到目前为止,已经与17家大数据企业签订了战略合作协议。当然,目前大数据在中国政府统计中的应用仍处于起步阶段,主要表现在两个方面:一是大数据成为政府统计数据的部分资料来源;二是大数据成为政府统计数据质量的部分评估依据。

(一)大数据成为政府统计数据的部分资料来源

目前,大数据已经成为中国政府统计数据的部分资料来源,以下是几个有代表性的方面:

1.利用重点网上零售交易平台数据测算网上零售额

为了掌握网上零售交易平台的交易规模和结构,综合测算网上零售数据,从今年1月份开始,国家统计局实施了月度网上零售交易平台调查,调查范围为42家重点网上零售交易平台,包括京东商城、亚马逊、当当网、淘宝网、天猫商城、酒仙网、美团网、中粮我买网、国美在线、大众点评网等。据对上述42家重点网上零售交易平台数据测算,今年1~8月份,全国网上零售额22400.9亿元,同比增长36.5%。其中,实物商品网上零售额18653.4亿元,增长35.6%,占全部网上零售额的83.3%;非实物商品网上零售额3747.5亿元,增长41.1%,占全部网上零售额的16.7%。这对于宏观管理部门和社会公众了解网上零售情况具有重要的参考作用。

2.利用房屋交易网签数据计算全国70个大中城市的新建住宅价格指数

房屋交易网签数据是指买卖双方签订购房合同后,房地产开发企业在房管部门进行备案,并在房产信息网上公布的相关信息,包含地址、楼层、价格、面积和金额等详细信息,基本涵盖了当月新建住宅的全部交易情况。从2011年1月份开始,国家统计局开始采用房屋交易网签数据计算全国70个大中城市的新建住宅价格指数。这对于提高70个大中城市新建住宅价格指数的数据质量起到了重要作用。

3.利用卓创资讯公司提供的价格信息,开展流通领域重要生产资料市场价格监测

国家统计局与卓创资讯公司开展合作,利用该企业提供的价格信息,开展流通领域重要生产资料市场价格监测。从2014年1月开始,按旬共同向社会发布流通领域9大类50种重要生产资料市场价格的检测结果。行业涵盖黑色金属、有色金属、化工产品、煤炭、石油天然气、非金属建材、农产品、农业生产资料、林产品等领域。地区监测范围覆盖北京、天津、河北、山西、内蒙古、辽宁、吉林、上海等24个省区市。这对于宏观管理部门和社会公众了解流通领域重要生产资料市场价格信息起到了重要作用。

(二)大数据成为政府统计数据质量的部分评估依据

国家统计局除了把大数据作为政府统计数据的部分资料来源外,也高度重视利用大数据评估政府统计数据质量。以下是目前比较有代表性的两个方面:一是利用中国银联跨行银行卡消费数据评估社会消费品零售总额数据质量;二是利用大型机械装备企业物联网数据评估固定资产投资数据质量。

二、大数据给政府统计带来的机遇与挑战

对于政府统计来说,大数据既带来了重大发展机遇,也带来严峻挑战。

(一)大数据给政府统计带来重大发展机遇

首先,大数据将不断提高政府统计服务宏观管理和社会公众的能力。随着大数据的不断发展和完善,随着政府统计机构开发应用大数据能力的不断提升,政府统计产品的种类将会不断丰富,政府统计数据的质量和时效性将会不断提升,从而政府统计服务宏观管理和社会公众的能力会不断提高。

其次,大数据将会推动政府统计发生革命性的变化。随着大数据的发展和完善,随着政府统计机构开发应用大数据技术的逐步成熟,政府统计将会发生革命性变化。一是现有的以周期性普查为基础,以抽样调查为主体,综合运用全面调查、重点调查等方法,并充分利用行政记录等资料的统计调查方法体系可能会发生重大变化。长期以来,抽样调查方法,即在总体中抽选样本、利用样本推算总体的方法;普查和全面调查方法,即对总体中所有单位逐一进行调查的方法,在我国政府统计中发挥了重要作用。今后,在较长的时期内这些方法仍然会被政府统计所广泛采用。但在大数据不断发展和完善的情况下,某些领域、某些方面的大数据可能会取代抽样调查、普查和全面调查方法,成为获取统计数据的重要方法,而且这种获取统计数据的方法将会变得越来越重要。二是政府统计中的数据采集方式可能会发生重大变化。长期以来,政府统计机构主要以企业填报、住户记账、调查员入户等方式采集原始数据。在大数据不断发展和完善的情况下,一部分原始数据将通过挖掘大数据的方式获取,而且这种新的数据采集方式将会变得越来越重要。三是政府统计的数据处理模式可能会发生重大变化。在大数据不断发展和完善的情况下,现行的对普查和全面调查数据进行直接审核、汇总、加工处理和对抽样调查数据进行推算放大的数据处理模式可能会发生重大变化。

(二)大数据给政府统计带来严峻挑战

首先,大数据对政府统计能力带来挑战。从大数据本身的产生到发展完善,从政府统计对大数据的初步运用到成熟运用,需要一个较长的时期。在这个过程中,一方面,政府统计中传统的统计调查方法、数据采集方式和数据处理模式将继续运行,否则满足不了宏观管理和社会公众的需求。另一方面,政府统计系统必须投入大量的人力和物力对大数据进行挖掘、加工处理和运用,否则也适应不了大数据时代宏观管理和社会公众的需求。这种双轨运行的模式,对政府统计能力将是一个巨大的挑战。

其次,大数据对传统政府统计理念带来挑战。传统的政府统计有一个约定俗成的理念:抽样调查方法可降低调查成本,提高效率和数据质量。因为抽样调查只对总体中部分抽中的样本进行调查,并非对总体中的每一个单位都进行调查,所以调查单位明显减少,可降低成本,节约时间,提高效率。同时,由于调查单位较少,政府统计机构有能力对基层统计调查人员进行较为扎实的培训和指导,有精力对统计调查数据进行较为严格的检查和审核,从而能够提高统计调查数据质量。随着大数据不断发展完善,政府统计机构将会越来越多地通过大数据企业间接地获取统计数据,不需要对总体中的具体单位进行直接调查,不需要调查员,从而也不需要对调查员进行培训,抽样调查所具有的调查成本低、能够提高统计调查数据质量的优点就不复存在了。

以上是小编为大家分享的关于大数据来了 给政府统计带来了机遇与挑战的相关内容,更多信息可以关注环球青藤分享更多干货

『贰』 大数据与统计学有什么联系

实际上,虽然在大数据时代背景下,统计学的知识体系产生了一定程度的调整,但是统计学本身的理念与大数据还是具有一定区别的,统计学注重的是方式方法,而大数据则更关注于整个数据价值化的过程,大数据不仅需要统计学知识,还需要具备数学知识和计算机知识。从另一个角度来说,统计学为大数据进行数据价值化奠定了一定的基础。

从技术体系结构来看,统计学知识主要应用在大数据分析领域,统计学方式是大数据分析的两种主要方式之一,另一种数据分析方式是机器学习。所以,对于主攻大数据分析方向的研发人员来说,掌握统计学知识还是很有必要的,统计学在数据分析方面已经形成了一个较为系统的知识体系,而且很多技术已经经过了实践的检验。其实对于很多职场人来说,平时大部分的数据分析任务都是基于统计学理论进行的,包括采用的数据分析工具也都属于统计学领域的范畴。

从未来的发展趋势来看,一方面统计学会进一步向大数据倾斜,包括目前不少统计学专业的研究生课题,都逐渐开始向大数据方向拓展,另一方面大数据会在发展的初期大量采用统计学相关理论和技术,这也能够提升大数据相关技术的落地应用能力。

『叁』 统计学专业与大数据有哪些不同统计学就业前景怎么样

统计学专业与大数据专业会有一些不同,但总体上是有相同之处都跟网络有关系统计信息数据的。同济学就业前景比较广阔,从事的岗位也比较多,可以从事计算工作,也可以从事销售工作,也可以去银行工作,这些岗位都是能够提供的。

因为市场的发展在不断完善,而且中国传统贸易化的发展越来越快,统计学工作的相关人员需求量越来越多,需要提供准确的消息,现在是大数据时代,如果统计学学的非常扎实。可以从事的工作也有很多,可以当数据分析师也可以从事银行金融类证券公司的工作人员。所以这个专业的毕业生需要有很强的技术能力才能有更好的发展,在校学习的知识也会增多。

『肆』 统计学的发展

统计学的发展过程的三个阶段
第一阶段称之为“城邦政情”(Matters of state)阶段
“城邦政情”阶段始于古希腊的亚里斯多德撰写“城邦政情”或“城邦纪要”。他一共撰写了一百五十馀种纪要,其内容包括各城邦的历史,行政,科学,艺术,人口,资源和财富等社会和经济情况的比较,分析,具有社会科学特点。“城邦政情”式的统计研究延续了一两千年,直至十七世纪中叶才逐渐被“政治算数”这个名词所替代,并且很快被演化为“统计学”(Statistics)。统计学依然保留了城邦(state)这个词根。
第二阶段称之为“政治算数”(Politcal arthmetic)阶段
与“城邦政情”阶段没有很明显的分界点,本质的差别也不大。
“政治算数”的特点是统计方法与数学计算和推理方法开始结合。分析社会经济问题的方式更加注重运用定量分析方法。
1690年英国威廉·配弟出版 (政治算数)一书作为这个阶段的起始标志.
威廉·配弟用数字,重量和尺度将社会经济现象数量化的方法是近代统计学的重要特征。因此,威廉?配弟的(政治算数)被后来的学者评价为近代统计学的来源,威廉?配弟本人也被评价为近代统计学之父。
配弟在书中使用的数字有三类:
第一类是对社会经济现象进行统计调查和经验观察得到的数字.因为受历史条件的限制,书中通过严格的统计调查得到的数据少,根据经验得出的数字多;
第二类是运用某种数学方法推算出来的数字。其推算方法可分为三种:
“(1)以已知数或已知量为基础,循著某种具体关系进行推算的方法;
(2)通过运用数字的理论性推理来进行推算的方法;
(3)以平均数为基础进行推算的方法”;
第三类是为了进行理论性推理而采用的例示性的数字.配弟把这种运用数字和符号进行的推理称之为“代数的算法”。从配弟使用数据的方法看,“政治算数”阶段的统计学已经比较明显地体现了“收集和分析数据的科学和艺术”特点,统计实证方法和理论分析方法浑然一体,这种方法即使是现代统计学也依然继承。
第三阶段称之为“统计分析科学”(Science of statistical analysis)阶段
在“政治算数”阶段出现的统计与数学的结合趋势逐渐发展形成了“统计分析科学”。
十九世纪末,欧洲大学开设的“国情纪要”或“政治算数”等课程名称逐渐消失,代之而起的是“统计分析科学”课程.当时的“统计分析科学”课程的内容仍然是分析研究社会经济问题。
“统计分析科学”课程的出现是现代统计发展阶段的开端. 1908年,“学生”氏(William Sleey Gosset的笔名Student)发表了关于t分布的论文,这是一篇在统计学发展史上划时代的文章。它创立了小样本代替大样本的方法,开创了统计学的新纪元。
现代统计学的代表人物首推比利时统计学家奎特莱(Adolphe Quelet),他将统计分析科学广泛应用于社会科学,自然科学和工程技术科学领域,因为他深信统计学是可以用于研究任何科学的一般研究方法.
现代统计学的理论基础概率论始于研究赌博的机遇问题,大约开始于1477年。数学家为了解释支配机遇的一般法则进行了长期的研究,逐渐形成了概率论理论框架。在概率论进一步发展的基础上,到十九世纪初,数学家们逐渐建立了观察误差理论,正态分布理论和最小平方法则。于是,现代统计方法便有了比较坚实的理论基础。

『伍』 大数据思维下的统计新变革

大数据思维下的统计新变革
日前,谷歌宣布其云计算平台通过大数据分析准确地预测了巴西世界杯8强。据了解,谷歌云计算平台使用了英国体育数据提供商Opta Sports的数据,评估了全球每个职业足球联盟过去多个赛季的情况,以及巴西世界杯小组赛期间的统计数据。于是乎,大数据再度成为舆论关注的焦点,对于其应用价值的讨论更加热烈。
然而,我们发现,即使以谷歌强大的技术实力,也不得不从英国体育数据提供商Opta Sports那里获取数据。也就是说,数据的采集并不是谷歌的优势,大数据产业走向商用和规模化发展,更多的要依赖Opta Sports这样的数据采集者。从这个角度看,作为最具权威性和采集能力的统计部门,无疑将是大数据产业发展壮大的基础。反过来看,从大数据发展的趋势看统计行业的发展方向,也必然全面应用大数据思维。我们注意到,从国家统计局局长马建堂在2012年年底提出“统计部门要拥抱大数据时代”,到不久前国家统计局在厦门建立首个大数据基地,可以断言,统计行业的大数据变革已经到来。
2013年11月,国家统计局与网络、阿里巴巴等11家企业签订了大数据战略合作框架协议。此举目的在于共同推进大数据在政府统计中的应用,不断增强政府统计的科学性和及时性。马建堂在协议签订时表示:“现在许多发达国家纷纷将大数据利用提升到国家战略层面,我们也要适应这一大势,将大数据视为国家战略资源,主动拥抱大数据时代,积极抢抓机遇、应对挑战。”数据与统计是一对共生词,而数据成为生产要素的前提条件也是有效的梳理与归类,这恰恰是统计的内容。马建堂说,大数据为政府统计提供了总体性、非结构化、丰富真实的原始资料,可以极大地缩短数据采集时间,减少报表填报任务,减轻调查对象负担,提高统计数据质量。
一场统计方式和方法的变革正在酝酿。企业既是大数据的主要生产者,也是经验丰富的使用者,还是大数据的直接受益者,有数据的资源、有应用的技术、有市场的机制。而国家统计局作为组织领导和协调全国统计工作的主管部门,具有统计制度和标准制定,统计数据搜集、发布、分析等方面的优势。
统计数据是各级领导作出科学决策的重要支撑。随着企业一套表建设的基本完成,各行各业的数据被采集上来,这只是第一步,用好这些数据是关键。企业一套表只是一个业务系统,更重要的是在这套系统上帮助统计部门搭建一套数据资源体系,通过这套体系来对数据进行规划、整理和加工,建设监测评价中心、辅助决策中心,这也是统计行业未来发展的必然趋势。
现在一些地方统计局已经开始做统计方面的规划和使用。例如原来的统计工作主要是查询,现在希望除了查询、检索、展示之外还具备监测、评价的功能。监测评价需要标准,在政府部门这个标准就是政策。监测是对企业、家庭等对象进行调查,数据上传之后经过计算、加工等与初定的指标相比较,并对监测结果进行评价,发现问题及时预警、报警。辅助决策则更需要智能化,当发现监测评价出的结果与初定指标存在较大差异时,就要追本溯源,为领导提供准确的问题分析报告,列出导致问题的主要原因,提出可行性建议,为领导提供辅助决策,为其做出下一个阶段的判断和调整提供帮助。例如,自去年以来,浙江温州市统计局建立了GDP联席会议制度,按季度召集30多个部门进行分析论证部门数据与GDP数据之间的关系,特别是充分运用电力、银行、交通、财政、外贸等部门数据,以及对GDP数据的影响,使GDP数据更加科学可靠。今年进一步扩大了GDP联席会议职能,把涉及部门的经济、社会、民生等监测评价数据进行综合审查分析,进一步提高统计数据质量。
与此同时,统计行业的大数据变革,也将为大数据产业的下一步发展打造坚实的基础。从企业一套表到电子终端采集数据,中国统计的技术和制度改革近两年不断深入,而与大数据概念的交汇与融合也将助推中国官方数据更加真实全面。统计部门在人口、农业、投资、交通等领域,大力研究利用遥感RS、地理信息系统GIS、全球定位系统GPS为代表的空间信息技术和物联网技术,既极大提升了统计信息化水平,也为进一步推进大数据的统计应用打下了较好的基础。

『陆』 统计学专业的学科发展

人类带着上个千年创造的辉煌跨入新的千年。面对忽忽到来的21世纪,每个人、每个实体、每个学科,乃至整个国家都面临机遇和挑战。欲行千里,始于足下,走好21世纪的头五年,至关重要。在此,我们将对21世纪的头五年,即中国经济社会发展的第十个五年计划中,统计学学科的发展予以厚望。
一、统计学学科的研究发展趋势
21世纪是知识经济的时代,信息技术、计算机技术为统计学理论与方法的发展将产生巨大的推动作用。知识创新是时代的基本特征。统计学理论与方法的创新必将为众多领域和学科的发展体现出应有的价值。统计学与其他学科的紧密结合将产生新的边缘学科,许多学科的发展将依赖于统计理论与技术的应用,更为复杂数据的处理方法将成为统计理论界研究的热点,实用快捷的统计方法与技术将更加普及。
二、十五”期间统计学学科研究的奋斗目标
“九五”期间统计学学科的建立为“十五”已打下了坚实基础,通过五年的努力,中国统计学理学类一级学科的地位将更加牢固,中国高等统计教育将发生较大的变化,大多数院校的统计专业将改造成适应一级学科地位的统计学,高校统计专业的课程设置将更具有时代特点,统计学理论与方法的应用将在社会主义市场经济建设中发挥重大作用。有些统计学理论研究与应用将缩小与世界水平的差距,在某些研究方面将达到世界先进水平。
三、“十五”期间统计学研究的重点领域
1.统计理论与方法的创新研究
统计学的生命力就在于应用,应用为统计学的发展赋予活力。
“十五”期间异方差性时间序列问题研究、离散多元统计分析研究、数据挖掘理论研究、异常数据诊断的研究、非参数理论与方法的研究、抽样与非抽样误差理论的研究等将是统计理论研究的热点。知识经济、新经济对统计理论与方法提出更高要求,如何适应电子商务时代统计数据的收集,空间遥感技术的运用等都为统计理论提出新挑战,统计工作者必须创新出适合各种复杂类型数据的统计方法才能适应实践的需求。
2.开展空间统计学理论与应用的研究
空间统计学是近几年统计学发展的一个新领域,主要指运用遥感技术进行国土资源的测定,农业和林业、海洋生物、环境生态的观测。这种观测数据通常表现为网络形式,而且这些数据受到大气效应、观测工具等诸多因素的影响。空间统计学的应用在于,针对这种特殊的数据,研究误差控制、数据处理、模型建立、统计推断。这将是统计学研究的新领域。
计算机技术的发展对统计学发展影响的研究
信息技术与计算机技术的发展是推动新经济发展的主要动力。可以断言,没有计算机的发展就没有统计方法的普遍有效应用。计算机技术的飞速发展为统计学方法的应用带来挑战和发展的机遇。统计数据的收集如何有效借助网络技术,统计调查方法如何适应现代信息技术,统计数据处理如何深入都将成为研究的热点问题。
3.生命科学与生物技术中统计方法的应用研究
21世纪是生命科学的世纪,人类不久将完全揭示人类基因排序。19世纪中叶基因学说的创立,就是依赖于统计推断技术,21世纪生命科学中将有大量的相关研究要借助统计方法与技术,这个领域的学者将大有作为。21世纪医学领域的科技创新,将使许多不治之症得到解决,生物制药将在医学领域大放异彩,统计学方法在生物制药技术中的广泛应用将是不争的事实。美国辉瑞制药公司每年投入50亿美金用于研究发展,在美的生物统计人员极易找到高薪的工作就足以说明这一领域的广阔前景。
4.国家经济安全与金融、保险领域的应用研究
国家的经济安全及其金融危机的防范问题是中国改革开放中必须高度重视的问题。国家经济安全、金融危机的预警系统的研究是与统计学方法紧密联系的研究热点,投资项目的风险管理研究也将依赖统计学者去研究解决。保险产品的精算理论与实践在“九五”期间得到一定的进展,为这一领域的深入发展奠定了基础,如何将发达国家保险精算的理论与中国保险业实际相结合值得深入研究,尤其是保险精算方法向社会保障领域延伸的研究是中国国情赋予给这个领域的迫切任务。
5.政府统计数据质量的进一步研究
政府统计数据的质量在“九五”期间得到国人的普遍关注。不仅国家哲学社科基金设立重点研究课题,几乎各地方政府也设专项研究,发表的论文已有近百篇。然而这方面的研究还有待深入,不仅从制度上约束、控制数据的可靠性,从检测、验证的方法上还需进一步探讨。有的重点课题已在检验方法上有所突破,但如何具体与中国政府实际数据紧密结合,实施这些方法还须加大力度进行研究和实践。
6.统计学在社会、人口、教育、环境等领域的应用研究
社会的发展、人口的控制、教育结构的调整与发展、环境的保护等领域存在着大量急待研究的问题,统计学方法是定性与定量研究的有力工具。统计学方法在这些领域将会有广阔的应用前景。
四、“十五”期间统计学重点研究课题及其简要论证
1. 中国统计教育发展战略研究
统计教育是统计科学长期发展的战略问题。但中国统计教育却存在着招生难、分配难、经费缺、师资不足、教材陈旧、课程设置不合理等诸多问题。因此,加强统计教育研究也是我们的重要课题。
研究内容包括:统计教育指导思想的研究;统计教育发展目标的研究;统计教育如何适应市场经济发展的要求,适应现代信息产业与信息技术的要求,适应与国际接轨的要求等问题,要研究统计教育改革与培养目标模式转换的问题;统计专业培养方案研究;研究统计教育基础理论课程设置和统计教育办学层次问题;研究统计教学方法及教学中计算机运用的问题;研究统计师资队伍建设与培养问题。
理学类一级学科的统计学课程建设的研究
中国大多数院校统计专业的课程设置基本上是前苏联的文科模式,这与国际接轨的理学类统计学严重不适应。统计学专业应该开设一些什么课程,这关系到统计专业是否得到社会认可,是关系到统计专业生存与发展的大问题。课程建设与课程设置、教材编写必须高度重视,这应该成为“十五”期间研究解决的主要课题之一。
关于提高政府统计数据质量问题的进一步研究部分统计数据的质量低,可靠性不够是从上到下各级领导与各界人士广泛关注的热点问题之一。提高和保证中国官方统计数据的质量,不仅是政府进行宏观决策重要保证,也是改善社会风气重要方面之一。要想从根本上提高和保证官方统计数据的质量,从统计学的角度看,必须解决好以下问题:(1)建立评价统计数据质量的质量标准;(2)对影响统计数据质量的各种因素进行系统分析,找出其中限制性环节;(3)对现有各种统计调查方法的实用性进行比较研究,确定适合中国国情的科学的统计调查方法体系;(4)建立统计数据质量控制体系,选择适当的方法和控制手段,对统计数据质量实现从指标、设计、调查、汇总到分布的全过程质量控制;(5)宏观总量数据的科学估算问题研究。这些问题在“九五”期间已得到较多研究,但是检验、诊断及控制数据质量的实践研究须进一步深入。
中国“地下经济”活动核算的理论和方法研究
过去几年,中国的“地下经济”问题表现很突出,并引起人们的关注。“地下经济”的存在,它的规模多大,性质如何,影响怎样,会影响到国民生产总值和人民生活水平的正确统计,影响对改革开放成果的评价,也影响到中国经济政策和调控措施的落实。对“地下经济”问题的研究、计量已是完善国民经济核算体系,改善客观经济管理的重要内容。西方国家对“地下经济”的研究已有20多年的历史,但一直没有形成十分成熟的理论和方法。结合中国“地下经济”的具体特点,研究“地下经济”核算的理论和方法,不仅具有现实意义,也具有国际意义。
对“地下经济”核算理论与方法的研究主要包括:“地下经济”的界定与划分;“地下经济”的核算范围;“地下经济”活动的性质及表现;“地下经济”的测算方法如直接调查法、间接推算法、各种测算方法的结合运用;“地下间接”调查方法体系的建立与实施;“地下经济”对国民经济核算的影响及分析,“地下经济”对国民经济发展影响的统计分析等。这一研究课题在“九五”期间就曾提出,但实质性的进展不大。
关于旅游经济、假日经济和休闲时间的统计研究
“十五”期间中国的经济结构将得到进一步调整,假日经济、旅游经济将占一席之地。关于这个领域统计指标体系的建立问题的研究,旅游客流量、宾馆入住率、景点门票收入、餐饮业收入、航空、铁路等运输客流量的预测研究等。随着人民生活水平的提高,生活质量及其休闲时间的规律研究对于制定有关政策,开发市场都具有重要的现实意义。这些都是统计科学应用的新课题。
抽样技术在社会经济统计调查中的应用
尽管从理论上讲,抽样技术从样本容量确定到抽样估计都已经比较成熟,但在抽样方法的具体应用过程中却存在许多难于解决的实际问题。尤其是运用抽样技术于社会经济现象的调查中更是如此。当前中国统计制度改革的重要内容之一是推行以抽样调查为中心,以定期普查为基础的新统计调查体系。而这要求我们必须解决应用抽样调查技术所面临的许多具体实际问题,包括:(1)抽样调查中国家样本和地方样本的协调与配合问题;(2)对于按某一标志代表性抽取的样本,如何保证其它标志的代表性问题;(3)抽样调查中的不回答问题;(4)抽样调查过程中调查误差的控制问题;(5)对于缺损数据的科学估算问题;(6)抽样调查方案设计与实施中其它问题。在研究过程中,始终要注意考虑中国的具体国情。“十五”期间更应关注网络技术和通信技术在抽样调查中的应用研究。
关于中国居民消费模式的量化研究
消费与收入之间有着密切的关系。消费函数是可支配收入与总消费支出之间关系的数学描述。研究中国居民消费与收入之间的关系,量测中国居民的消费水平,探讨影响居民消费的主要因素。研究者应考虑到影响消费的众多因素,利用统计数据,建立消费模型,并总结建立中国消费函数应注意的问题和经验。
中国第五次人口普查数据资料的深度分析
2000年11月1日的第五次人口普查是跨入21世纪的一次规模最大的统计调查,这些大量数据无疑隐含着非常宝贵的信息,对这些数据的深入挖掘和分析,为国家制定各种宏观政策将起到巨大作用。过去受统计人员水平和计算机水平所限中国对人口普查数据的挖掘远不如国外的竞争对手。“十五”期间对第五次人口普查数据的深入分析是中国政府统计界的一大任务。
关于灾害损失统计指标与方法的研究
自然灾害是人类不能回避的一个现实问题,几乎每年都有不同的自然灾害,给人民生命财产造成极大损失。总结研究自然灾害及其造成的损失具有重大的现实意义。统计指标的建立,数据的收集,规律的探讨这是总结和掌握灾害规律的重要过程。统计理论和方法在这一领域将会发挥重要作用。
金融市场风险的测度及管理模型研究
金融市场是具有高风险的市场。运用统计方法研究金融风险,建立风险监测系统,不仅能够为管理层宏观调控金融市场提供科学的理论依据,而且对投资个人和机构实施风险控制具有重要指导作用。本课题立足中国金融市场,旨在从数量及数量关系上研究风险的测度方法,风险管理模型的选择及其管理对策。
SPC技术在产品质量控制中的应用
产品的质量关系到企业的生存。中国许多企业非常重视产品质量控制,从产品的设计到生产的全过程的质量管理已经有些经验。但是这方面仍有潜力可挖,特别是统计方法在质量管理中的运用与发达国家差距较大。该课题研究应紧密结合某企业或某产品的生产过程,运用统计方法,实施产品设计、生产的全过程控制。这方面的研究可结合企业ISO9000认证进行。还可进一步探讨“6”质量标准在中国企业的推广应用。
高新技术产业的综合考核与评价研究
关于企业经济效益的综合评价研究在过去已有不少,然而高新技术企业的评价考核指标体系的建立仍是一个新问题。高新技术企业与传统企业的评价指标应有严格的不同,应具有高新技术的自身特点。这方面研究需要政府统计与企业统计人员一起进行研究,探讨指标体系的建立,数据的收集、数据的分析等。
关于数理统计方法普及和推广的研究
数理统计方法的科学性已被中国广大统计工作者所接受,但由于历史原因,中国社会经济统计界对数理统计的基本理论和方法了解甚少。许多数理统计方法数学味太浓,实际统计工作者难以掌握。如何普及数理统计方法,使广大统计工作者容易掌握,并在实践应用中有很强的可操作性是需研究的问题。研究者需提出切实的可行性方案,并给予论证。
多元统计方法在社会经济数据处理中的应用
多元统计分析是研究多个变量间相互关系的一个数理统计分支。经济问题的复杂多样性,经济因素间的互相制约性,通过多元分析的一些方法,研究经济变量之间的相互关系,寻找影响经济现象的主要因素是非常有效的方法。研究者可结合社会主义建设中的任何具体问题进行研究,并注意总结多元统计方法在实际应用中存在的问题。
时间序列分析在经济预测中的应用
这里所说的时间序列是随机时间序列的分析,时间序列分析是数理统计中的一个重要分支。许多经济指标都可依时间顺序得到一串经济数据,按时间顺序排列的经济数据就是经济时间序列。利用时间序列方法研究中国的某些经济指标的变化情况,建立相应的序列分析模型,并用时序模型去预测某经济指标的未来数值为国家的宏观调控服务。研究者应注意在中国应用时间序列方法存在的问题,克服中国经济数据的一些缺陷,大力开展VaR模型技术的应用,总结时序分析在中国应用的经验。
复杂动态随机系统的统计学方法研究
在社会、经济、自然等领域,经常遇到的反映现实的系统都是非常复杂的动态随机系统,它们的特征是,系统本身非常复杂,需要用成千上万个参数进行描述,而且有关数据一般只能通过观察而非实验来取得。此外,在这些系统的研究中,随机化和可重复性难于保证。这样,就使得现有的各种统计学方法的应用效果不理想。在经济学研究中,现有各种大规模经济计量模型在分析预测社会经济现象及其趋势时,经常出现失误,就是一个明显的例证。究其原因主要有:(1)模型过于抽象,脱离实际太远;(2)依据的数据质量不高;(3)采取的统计方法要求的前提条件不能满足。类似的例子在研究许多生态、环境中的大系统问题时也经常出现。
统计方法在教育、考试测量研究中的应用
通过对各种考试现有资料的分析处理,并进行适当的实验测试分析研究,寻找出各种考试的自身规律和特点,为更好地组织考试提供科学依据。要列举出考试中各种因素,运用统计方法,分析研究这些因素对考试的影响,找出各主要影响因素,为更有效地控制这些因素提供方法和依据。这方面的研究是多变量的统计方法的应用。多元统计分析方法是这一领域地主要研究工具。
统计学方法在生命科学、生物制药等领域的应用
生命科学、生物制药的研究在21世纪将得到飞速发展。这一领域的发展带动统计学理论与技术的发展,为统计理论和方法找到广阔的应用领域。通过对这一领域的应用将拓宽统计方法在中国的应用,也必将促进统计方法与理论的完善。
参考文献:
1.1996——1998年普通高校人文社会科学统计资料汇编
2.教育部人文社会科学研究第二届优秀成果奖获奖成果简介汇编
3.教育部人文社会科学重点研究基地建设试点工作文件汇编
4.普通高等学校人文社会科学研究“九五”规划咨询报告汇编
5.全国哲学、社会科学“九五”期间统计学发展回顾与“十五”期间研究的重要领域、方向与研究。

『柒』 大数据时代对统计学和经济学有何影响

已上提问是统计学基本概念不清楚:有的学者认为大数据时代统计学过时了;实际上:回这是一种错误学说,答就是一个大呼悠。所为的大数据就是数据流大一点而已,从数据扩展到信息,并没有超出统计学描述的范围;也就是互联网、计算机、苹果手机,小朋友手机摇啊摇,小姑娘们聊啊聊,帅哥键盘敲啊敲,这些数据、信息、资料、图片向白云一样飘啊飘,飘到空间瞬间形成庞大的几十万亿的数据云。最后这些数据流我们用计算机通过统计学专家学者加已整理、分析;这就对统计学家提出了新的挑战。统计学是通过搜索、整理、分析、描述数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学。其中用到了大量的数学及其它学科的专业知识,它的使用范围几乎覆盖了社会科学和自然科学的各个领域。

『捌』 大数据时代下,传统统计学有哪些变革

“社会统计学与数理统计学的统一”理论的重大意义



王见定教授指出:社会统计学描述的是变量,数理统计学描述的是随机变量,而变量和随机变量是两个既有区别又有联系,且在一定条件下可以相互转化的数学概念。王见定教授的这一论述在数学上就是一个巨大的发现。

我们知道“变量”的概念是17世纪由著名数学家笛卡尔首先提出,而“随机变量”的概念是20世纪30年代以后由苏联学者首先提出,两个概念的提出相差3个世纪。截至到王见定教授,世界上还没有第二个人提出变量和随机变量两者的联系、区别以及相互的转化。我们知道变量的提出造就了一系列的函数论、方程论、微积分等重大数学学科的产生和发展;而随机变量的提出则奠定了概率论和数理统计等学科的理论基础和促进了它们的蓬勃发展。可见变量、随机变量概念的提出其价值何等重大,从而把王见定教授在世界上首次提出变量、随机变量的联系、区别以及相互的转化的意义称为巨大、也就不视为过。

下面我们回到:“社会统计学和数理统计学的统一”理论上来。王见定教授指出社会统计学描述的是变量,数理统计学描述的是随机变量,这样王见定教授准确地界定了社会统计学与数理统计学各自研究的范围,以及在一定条件下可以相互转化的关系,这是对统计学的最大贡献。它结束了近400年来几十种甚至上百种以上五花八门种类的统计学混战局面,使它们回到正确的轨道上来。

由于变量不断地出现且永远地继续下去,所以社会统计学不仅不会消亡,而且会不断发展状大。当然数理统计学也会由于随机变量的不断出现同样发展状大。但是,对随机变量的研究一般来说比对变量的研究复杂的多,而且直到今天数理统计的研究尚处在较低的水平,且使用起来比较复杂;再从长远的研究来看,对随机变量的研究最终会逐步转化为对变量的研究,这与我们通常研究复杂问题转化为若干简单问题的研究道理是一样的。既然社会统计学描述的是变量,而变量描述的范围是极其宽广的,绝非某些数理统计学者所云:社会统计学只作简单的加、减、乘、除。从理论上讲,社会统计学应该复盖除数理统计学之外的绝大多数数学学科的运作。所以王见定教授提出的:“社会统计学与数理统计学统一”理论,从根本上纠正了统计学界长期存在的低估社会统计学的错误学说,并从理论上和应用上论证了社会统计学的广阔前景。

『玖』 大数据时代,统计学还有用吗

大数据时代,统计学还有用吗_数据分析师考试

在数据“爆炸”的时代,大数据常常被寄予厚望。到底,什么样的数据才算大数据,怎样才能用好大数据,传统统计学还有用武之地吗?清华大学统计学研究中心前不久成立,著名统计学家、哈佛大学终身教授刘军担任主任。日前,刘军做客人民日报、人民网《文化讲坛》,分享他的思考。

让大数据区别于数据的,是其海量积累、高增长率和多样性

什么是数据?数据(data)在拉丁文里是“已知”的意思,在英文中的一个解释是“一组事实的集合,从中可以分析出结论”。笼统地说,凡是用某种载体记录下来的、能反映自然界和人类社会某种信息的,就可称之为数据。古人“结绳记事”,打了结的绳子就是数据。步入现代社会,信息的种类和数量越来越丰富,载体也越来越多。数字是数据,文字是数据,图像、音频、视频等都是数据。

什么是大数据呢?量的增多,是人们对大数据的第一个认识。随着科技发展,各个领域的数据量都在迅猛增长。有研究发现,近年来,数字数据的数量每3年多就会翻一番。

大数据区别于数据,还在于数据的多样性。正如高德纳咨询公司研究报告指出的,数据的爆炸是三维的、立体的。所谓的三维,除了指数据量快速增大外,还指数据增长速度的加快,以及数据的多样性,即数据的来源、种类不断增加。

从数据到大数据,不仅是量的积累,更是质的飞跃。海量的、不同来源、不同形式、包含不同信息的数据可以容易地被整合、分析,原本孤立的数据变得互相联通。这使得人们通过数据分析,能发现小数据时代很难发现的新知识,创造新的价值。

通过数据来研究规律、发现规律,贯穿了人类社会发展的始终。人类科学发展史上的不少进步都和数据采集分析直接相关,例如现代医学流行病学的开端。伦敦1854年发生了大规模的霍乱,很长时间没有办法控制。一位医师用标点地图的方法研究了当地水井分布和霍乱患者分布之间的关系,发现有一口水井周围,霍乱患病率明显较高,借此找到了霍乱暴发的原因:一口被污染的水井。关闭这口水井之后,霍乱的发病率明显下降。这种方法,充分展示了数据的力量。

本质上说,许多科学活动都是数据挖掘,不是从预先设定好的理论或者原理出发,通过演绎来研究问题,而是从数据本身出发通过归纳来总结规律。近现代以来,随着我们面临的问题变得越来越复杂,通过演绎的方式来研究问题常常变得很困难。这就使得数据归纳的方法变得越来越重要,数据的重要性也越发凸显出来。

大数据是非竞争性资源,有助于政府科学决策、商家精准营销

大数据时代,数据的重要作用更加凸显,许多国家都把大数据提升到国家战略的高度。

政府合理利用大数据,引导决策的将是基于实证的事实,政府会更有预见性、更加负责、更加开放。中国古代治国就已经有重数据的思想,如商鞅提出,“强国知十三数……欲强国,不知国十三数,地虽利,民虽众,国愈弱至削”。大数据时代,循“数”治国将更加有效。小数据时代,政府做决策更多依凭经验和局部数据,难免头痛医头、脚痛医脚。比如,交通堵塞就多修路。大数据时代,政府做决策能够从粗放型转向集约型。路堵了,利用大数据分析,可以得知哪一时间、哪一地段最容易堵,或在这一地段附近多修路,或提前预警引导居民合理安排出行,实现对交通流的最佳配置和控制,改善交通。

对于商家来说,大数据使精准营销成为可能。一个有趣的故事,是沃尔玛超市的“啤酒、尿布”现象。沃尔玛超市分析销售数据时发现,顾客消费单上和尿布一起出现次数最多的商品,竟然是啤酒。跟踪调查后发现,有不少年轻爸爸会在买尿布时,顺便买些啤酒喝。沃尔玛发现这一规律后,搭配促销啤酒、尿布,销量大幅增加。大数据时代,每个人都会“自发地”提供数据。我们的各种行为,如点击网页、使用手机、刷卡消费、观看电视、坐地铁出行、驾驶汽车,都会生成数据并被记录下来,我们的性别、职业、喜好、消费能力等信息,都会被商家从中挖掘出来,以分析商机。

大数据也将使个人受益。从生物学、医学上讲,以前生物学家只是通过对单个或几个基因的操控来观察其对生物体的影响,很难发现整体的关联。现在由于技术的发展,可以分析很多,如遗传信息、全体基因的表达量信息、蛋白质族谱信息、全基因组甲基化信息、表观遗传信息等。同时还有个人健康指标、病历、药物反应等数据。如果真能达成生物学上多维多向数据的有机融合,就能够把个人完整地描述出来,从而实现精准医疗的目的。

大数据时代,审核数据的真实性也有了更有效的手段。大数据的特征之一是多样性,不同来源、不同维度的数据之间存在一定的关联度,可以交叉验证。例如,某地的工业产值虚报了一倍,但用电量和能耗却没有达到相应的规模。这就是数据异常,很容易被系统识别出来。发现异常后,相关部门再进行复核,就能更有针对性地防止、打击数据造假。

数据是一种资源,但数据又跟煤、石油等物质性资源不一样。物质性资源不可再生,你用多了,别人就用少了,因而很难共享。数据可以重复使用、不断产生新的价值。大数据资源的使用是非恶性竞争的,共享的前提下,更能够制造双赢。从另一个角度来说,数据如果不被融合、联系在一起,也不能称之为大数据。

大数据不能被直接拿来使用,统计学依然是数据分析的灵魂

现在社会上有一种流行的说法,认为在大数据时代,“样本=全体”,人们得到的不是抽样数据而是全数据,因而只需要简单地数一数就可以下结论了,复杂的统计学方法可以不再需要了。

在我看来,这种观点非常错误。首先,大数据告知信息但不解释信息。打个比方说,大数据是“原油”而不是“汽油”,不能被直接拿来使用。就像股票市场,即使把所有的数据都公布出来,不懂的人依然不知道数据代表的信息。大数据时代,统计学依然是数据分析的灵魂。正如加州大学伯克利分校迈克尔·乔丹教授指出的,“没有系统的数据科学作为指导的大数据研究,就如同不利用工程科学的知识来建造桥梁,很多桥梁可能会坍塌,并带来严重的后果。”

其次,全数据的概念本身很难经得起推敲。全数据,顾名思义就是全部数据。这在某些特定的场合对于某些特定的问题确实可能实现。比如,要比较清华、北大两校同学数学能力整体上哪个更强,可以收集到两校同学高考时的数学成绩作为研究的数据对象。从某种意义上说,这是全数据。但是,并不是说我们有了这个全数据就能很好地回答问题。

一方面,这个数据虽然是全数据,但仍然具有不确定性。入校时的数学成绩并不一定完全代表学生的数学能力。假如让所有同学重新参加一次高考,几乎每个同学都会有一个新的成绩。分别用这两组全数据去做分析,结论就可能发生变化。另一方面,事物在不断地发展和变化,同学入校时的成绩并不能够代表现在的能力。全体同学的高考成绩数据,仅对于那次考试而言是全数据。“全”是有边界的,超出了边界就不再是全知全能了。事物的发展充满了不确定性,而统计学,既研究如何从数据中把信息和规律提取出来,找出最优化的方案;也研究如何把数据当中的不确定性量化出来。

所以说,在大数据时代,数据分析的很多根本性问题和小数据时代并没有本质区别。当然,大数据的特点,确实对数据分析提出了全新挑战。例如,许多传统统计方法应用到大数据上,巨大计算量和存储量往往使其难以承受;对结构复杂、来源多样的数据,如何建立有效的统计学模型也需要新的探索和尝试。对于新时代的数据科学而言,这些挑战也同时意味着巨大的机遇,有可能会产生新的思想、方法和技术。

以上是小编为大家分享的关于大数据时代,统计学还有用吗的相关内容,更多信息可以关注环球青藤分享更多干货

阅读全文

与大数据背景下统计学的发展相关的资料

热点内容
网络机顶盒移动网络 浏览:391
iphone手机百度云怎么保存到qq 浏览:148
数据库设计与实践读后感 浏览:112
js对象是什么 浏览:744
网页文件存pdf 浏览:567
文件夹正装 浏览:279
刚复制的文件找不到怎么办 浏览:724
试运行适用于哪些体系文件 浏览:987
ghost文件复制很慢 浏览:967
杰德原车导航升级 浏览:240
编程dest是什么意思 浏览:935
linux端口镜像 浏览:820
iphone5屏幕清尘 浏览:157
机顶盒密码怎么改 浏览:672
w7系统下载32位教程 浏览:618
pcb文件包括哪些内容 浏览:598
g00文件 浏览:607
用bat程序删除程序 浏览:516
dnf鬼泣90版本打安图恩 浏览:668
245倒角编程怎么计算 浏览:599

友情链接