⑴ 苏州固锝大数据分析股票
长期以来人们称为"工业之母"的是半导体,"中国芯"得到政策支持,未来将会给半导体行业带来新机遇,相关产业也可以受益于这一逻辑带来的新发展机遇。苏州固锝取得的优异成绩不仅仅局限在半导体这一个领域,同时也受益于光伏高速发展带来的全新契机。我们下面要聊的这个企业,同时脚踩两大高景气赛道。
还没对苏州固锝做相关分析前,我整理好的半导体行业龙头股名单分享给大家,领取方式很简单,点击一下就行了:【宝藏资料】半导体行业龙头股一览表
一、公司角度
公司介绍:
公司在半导体行业的地位可不低,属于全国电子行业半导体十大优质企业,主营业务有半导体整流器件芯片、功率二极管、整流桥和 IC 封装测试。其中公司整流二极管销售额连续十多年是中国领头羊,同时公司拥有 MEMS-CMOS 三维集成制造平台技术及八吋晶圆级封装技术,这一技术对公司早先的国内先进技术水平有明显的影响,提升至了国际先进水平。
跟大家分析完了公司的基本情况之后,接下来就来瞧一瞧公司独特的投资优点。
亮点一:质量保证,国内领先,服务全球
公司自成立以来,全身心扎根于半导体整流器件芯片、功率二极管、整流桥和 IC 封装测试领域,且自身拥有行业内最完整的质量、环境、信息安全、职业安全健康等管理体系,因此可以确保产品技术领先和质量稳定。
在国内市场上,整流二极管销售额连续十多年居中国第一;在国际市场上,公司的二极体成功进入全球第一梯队的相关企业中,他们所掌握的芯片核心技术总共有两千多个。
公司还先后被松下、索尼、比亚迪、飞利浦、佳能、三星、通用、西门子、美的等多家国际大公司评为优秀供应商或合作伙伴,如今这个行业的世界前三大生产商已经和公司确立了 OEM/ODM 合作关系,整合半导体行业是它所具备的资源优势。
亮点二:布局光伏,两高景气赛道并进
苏州晶银新材料科技股份有限公司是总公司在2011年设立的控股子公司,正式进入光伏领域。主营业务为导电银浆的研发、生产和销售,作为导电银浆供应商,在国际上都比较有名,也是太阳能电池银浆全面国产化的先锋队。
银浆有些什么具体作用呢?它也就是电池片结构中核心电极材料,占电池片非硅成本比例大约33%,在提升太阳能光伏电池的转换效率方面起着重要的作用。
2021年开始,光伏电池的技术路线由PERC进化为异质结(HJT),而HJT针对于银浆的单位耗量增加,将会促进公司业绩释放。同时,国内光伏银浆产业起步较晚,早期主要是依靠进口,因此,这是光伏行业唯一没有实现全面国产化的细分,所以银浆未来仍具较大成长空间。
当然,苏州固锝的投资优势我是远远没有说完的,因为没办法在这全部讲完,更多关于苏州固锝的深度报告和风险提示,给你们放到这篇研报中了,点开就可看到:【深度研报】苏州固锝点评,建议收藏!
二、行业角度
国内一直在半导体领域加速追赶海外巨头,成立半导体大基金进行产业投资,而且还为了半导体行业出台了相关政策,期待核心技术能够尽快实现国产替代,避免再一次被海外限制,而这也决定了半导体在国内将迎来千载难逢的发展机遇;光伏领域不仅有国内"双碳"政策支持,国外也有很多相关政策支持,光伏的发展机遇也正在到来。
三、总结
结合上面谈的这些, 我们会更加相信,脚踩半导体和光伏两大高景气度赛道的苏州固锝,在未来有着极大的发展空间与前景,所以不用担心股票上升的问题。但是文章不会实时更新,再好的逻辑都难抵短期的下跌,想了解苏州固锝未来行情的小伙伴,答案就在这个链接里,里面有很多专业的投资顾问是可以帮你判断股票的,分析一下苏州固锝估值这方面,究竟是高是低:【免费】测一测苏州固锝现在是高估还是低估?
应答时间:2021-09-08,最新业务变化以文中链接内展示的数据为准,请点击查看
⑵ 因为大数据10大行业正在改变
因为大数据 10大行业正在改变
进入大数据时代是一场跟不上就被淘汰的比赛。无论你是一家独立经营的实体商店,还是下一个美国硅谷的“独角兽”,当务之急都是在商业决策中采用大数据战略。与其说是因为数据很有价值,还不如说是数据正在改变商业经营的方式。
去年十月,在埃森哲和通用电气联合发布的调研报告中突破性地指出了这一紧迫性。89%的调查者认为,一家没有大数据战略的企业将在明年就遭到市场份额和发展势头方面的损失。虽然报告侧重的是工业互联网和医疗保健,但其中的结论对于其他行业仍有很大启示。
大约一年后,将会有10个行业因大数据战略而迅速变革。事实上,84%的企业认为大数据将在未来一年重塑竞争版图。所以即使你所处的行业不在其列,留意下周围那些正在经历这场巨变的公司也没有坏处。
10、能源产业技术和物联网颠覆了能源产业。从微观上看,有像Quirky公司的Aros这样的智能空调设备,它不但可以利用数据学习用户习惯和温度偏好,保持屋内凉爽和舒适,而且几乎不需要浪费多少能源。从宏观上看,有覆盖国家的智能网络。这一试点项目将大量的能源使用数据收集起来,帮助我们形成更好的能源使用习惯、减少碳排放和不必要的能源使用。
9、房地产行业房地产是推动市场的中坚力量。在2008年,我们看到了这一力量消极的一面,但所幸只是是产生了个体规模上的影响。可见房地产有可能带来丰厚的个人收益,也有可能对个体资产造成毁灭性的打击——只是需要衡量风险有多大。所以如果有个方法可以规避这种风险的话……
大数据就是答案,它将从三个方面上提高房地产交易质量和降低投资风险。首先,资产分析方式将改变。利用数据可以分析楼盘质量、楼盘寿命、结构完整性等。“账目上是否可信?”“是否有必要申请贷款?”都将从大数据分析中找到答案。第二,大数据将促成更精明的交易。对大量的客户投资进行评估后,可以提供更明智的方案来更快敲定交易。第三,大数据将提高物业管理水平。数据可以帮助更快发现和修复故障,再加上智能家居技术的应用,可以减少不少事故带来的不利影响。
8、保险行业保险行业从来没有像过去5年那样备受关注,当然这很大程度上是因为对于这一领域的总统立法,不过这好歹也让人们开始关注这个系统内固有的缺陷和复杂了。
保险公司必须从各个角度来考量协议:对保险供应商最优的方案是什么,对客户最明智的选择是什么,如何尽可能吸引到更多的用户,如何降低总体风险……以此看来,保险行业将是产生大数据变革的一片沃土。
其实,大数据正在改变这个行业:利用大数据提高索赔分析的效率,为个人提供更多的定向方案,反欺诈,甚至于为病患投保者提供保健的方法。
自助保险初创企业,MetroMile,为客户提供“开多少公里,扣多少保费”的车险业务,即按英里计保费。MetroMile表示,该业务可以帮助不常开车的客户平均一年省下500美元的保费。
总的来说,保险业的大数据分析可以促使系统快速迭代,不断改进。
7、音乐产业你可能在最近几周看了很多关于像Spotify和 Tidal 公司的得与失的消息。尽管在过去十年音乐市场急速缩减,艺人唱片公司仍在苦苦摸索从所有人身上用音乐赚钱的方式——包括从艺人身上——不单单是提高演唱会的票价或迫使艺人全年364天都在全球巡回演出的路上。
问题是他们并没有找到很好的赚钱方法。直到 Spotify 公司解决了如何为艺人的流音乐支付实质工资的问题后,Taylor Swift 才同意成为旗下一员。没人愿意每月花费20美元在 Jay Z 的“高保真”歌曲上,而他们在 Spotify 上完全不用花钱就可以听到 。
一种可能的解决方法是与广告商合作。社交媒体上收集的大数据表明,特别是在Instagram, 品牌和艺人间的品牌合作,即艺人作为品牌摄影师,可以为双方带来可观的利润,同时并不会损害艺人的形象。
基于社交媒体和流音乐网站的连接,听音乐的人群统计数据也变得很容易获得,唱片公司可以并且已经开始运用这些数据跟品牌做出战略性的合作,而这些品牌可以为艺人品牌化的音乐和视频买单。
6、航空业大数据将打破信息和航空业之间的裂缝,特别是在商业航空旅行领域。每年从商旅上收集的大量数据,甚至是每日收集的数据,在规划航线、制定激励计划、提升销量上,仍有大量可利用的空间。
首先就可以做质量管控。IBM一项研究表明,在飞行上收集的大量数据可以快速减少航线在设备和维修上的成本,这点无疑可以使航空公司更具竞争市场,减少票价成本,最终驱动销售。与此同时,飞行方面的数据也可以帮助节约时间、减少晚点和改善行李管理,甚至可以为后续航班推荐和客户留存提供智能指导。
5、电信业如果你看过关于NSA告密者 Edward Snowden 的纪录片 《第四公民》,那么你应该已经理解了电信业和数据的联系。利用元数据,似乎会让你发布的 Instagram 图片泄露你的位置。但在下面这个案例中,这不是数据改变电信行业的原因。
T-Mobile 合并了所有的客户数据集,将其分为六大类,以此来进行完整的客户行为分析,最终分析使得客户流失率降低了50%。简而言之,大数据分析帮助 T-Mobile 得出影响客户做出是否续用电信服务的因素,然后成为了他们做出调整的依据。
4、生活消费品产业关于大数据对于生活消费品产业的变革并不用说太多,事实上,只需要两个词就足够,供给和需求。
你可能已经注意到大部分的咖啡店都将以往笨重老旧的POS机更换成了更加轻便的 iPad 样式的 POS 系统,像是 Square 解决方案。Square 是小范围信用卡处理系统,它可以帮助实体商户收集大量客户数据,这也意味着独立经营的商户自己就可以很容易地收集数据。
这些数据首先也是最重要的事情就是为上下浮动的货品和供应提供智能指导,也可以帮助商户为大量购买的情况做好准备,更加理解消费者的统计信息,帮助商户运营得更有效率。大数据可以为每个人的首要之事(商户的账目和消费者的需求)都提供更好的分析。
3、酒店管理业酒店管理业不死——不管以何种形态存在。我们总是会去旅行,总是需要假期,只是需要解决旅行方式、地点和时间的问题。一些公司过分依赖这种模式,而忽视了共享经济带来的变化,像是Airbnd 这种公司带来的变化。但是也有 Duetto 这样的公司,给这个市场带来了新的竞争力。【译者注:Airbnb,联系旅游人士和家有空房出租的房主的服务型网站。Duetto,酒店定价管理 SaaS 服务商】
Duetto 为酒店提供客户行为习惯数据,帮助酒店管理房间预订、调整房间定价,甚至于预测需求量。人们总是在旅行,其中产生了大量酒店可利用的数据,而 Duetto 将它们变得极易获取并且易于分析。
2、游戏业在过去十年游戏业是爆炸性产业。随着《光环5:守护者(Halo 5: Guardians)》在这个秋天的发布,这款游戏已为微软在全球创收达35亿美元。单单这一系列不仅撑起了 Xbox One 的销售,并且成为索尼 PS4 的有力竞争者。【译者注:Halo,《光晕》(又名:光环),微软,发行的第一人称射击游戏之一】
然而游戏世界并不是只有这两家独大。魔兽世界Steam游戏平台等都促成了市场的生机和繁荣,十余亿的忠实粉丝参与其中。而现如今的游戏业也已经开始利用大数据来进一步改善体验。从30年前NES游戏平台产生以来,我们已经走过很远的路。
社交连接性和大型线上多人玩家游戏产生可观的数据,利用这些数据可以整体提升玩家体验。随着游戏的持续迭代和内容更新的下载,得到反馈并且立即做出提升用户体验的应对变得相当容易。
1、数据存储业最后是数据存储业。由于数据量很大而且在各行各业都有其不同的特性,亟需找到一种存储入库数据的方法,这种方法不需要大量服务器的要求也没有笨重的CRM系统。
Box 的解决方案应运而生。他们希望颠覆商业存储和利用数据的方法,使得各种规模的公司都可以很轻松地分析处理数据并从中获益。
无论你身处哪个行业,市场版图已然改变。赶紧打破所在行业和数据的壁垒吧,不然你的公司将沦为市场上落后的一员。
以上是小编为大家分享的关于因为大数据10大行业正在改变的相关内容,更多信息可以关注环球青藤分享更多干货
⑶ 央视报道称 iPhone 位置跟踪功能威胁国家安全,有依据吗
使用网络,你可以被定位到。智能手机也可以定位。该功能机也可以定位。
因此,保密单位不能进入外部网络,或添加防火墙、加密数据。杜绝使用手机。
今年中央明确支持国内手机市场,现在有效果,三星、索尼和其他制造商的市场份额已经下降,苹果一直牢牢占据高端市场,这样的报道来理解或理解人们问周围的人都知道是假的,这份报告对这些人没有影响
就像许多人们看到报道,肯德基鸡有激素,但也吃肯德基,但是,会有一些人会害怕,不敢吃
当我在浙江、私人老板很多,家里做一个小工厂很多人买苹果,其中不乏很多人买苹果手机只是为了面子,不知道很多科学和技术,也不关心,看到央视报道,我觉得会有很多人会相信。
⑷ 液晶电视排行榜
根据123网全网大数据,根据2020年1月的销量评选出了2020年液晶电视十大品牌排行榜,前十名分别是松下、索尼、东芝、三星、乐视、统帅、荣事达、KKTV、麦凯龙、vidaa 。
五、乐视
乐视成立于2004年中国,隶属乐视网信息技术(北京)股份有限公司,创始人为贾跃亭,乐视致力于打造融合视频产业、内容产业和智能终端为一体的完整链条,“乐视模式”也由此而来。乐视涵盖范围广,互联网资源技术配合影视产品的制造发行以及新设备技术,如智能终端和应用市场等业务的开展,仅2014年,乐视全生态业务的收入就已经接近100亿。
⑸ 创维q41 pro和索尼x90J如何选
选创维Q41 Pro好些。
创维Q41 Pro在整体设计和细节方面做的比较出众。超大屏占比,创维Q41 Pro看起来很具有科技感。而比较光彩夺目的,就是创维Q41 Pro的超窄边框,闪烁着金属特有的光芒。纯金属的中框,可以看到带有1.5mm的斜切钻石高光。这样的设计,在客厅灯光的照射下,熠熠生辉。细节很到位,也凸显了产品的高端定位。
创维集团有限公司(英文名称:Skyworth Group Co.,Ltd,中文简称创维集团或创维)成立于1988年,是一家从事多媒体(智能电视、机顶盒、内容运营)、家用电器(冰箱、洗衣机、空调、厨房电器等智能化产品业务)、智能系统技术与大数据、现代服务业等业务的智能家电与信息技术企业。
创维拥有创维集团(HK00751)和创维数字(000810)两家上市公司、十多家国家认定高新技术企业,设有国家级企业技术中心和国家级工业设计中心,累计申请专利5700多项。
⑹ 请问上海十大房产律师事务所有哪几家
具体哪几家不是特别清楚,但是我可以推荐上海秦兵律师事务所,业务能力很强,经验很丰富,团队平均办案经验超过5年。
⑺ 索尼高速SSD专利曝光 适合写入大数据或为PS5硬盘雏形
索尼将在PS5上采用SSD,这样主机的读取 游戏 速度将比PS4和PS4 Pro快上很多。ResetEra用户gofreak发现了索尼的一项新专利,或许PS5的高速SSD方案雏形就是来自这个专利。
该用户指出,专利中定制的SSD将采用SRAM而不是DRAM,这能减少延迟并提高闪存控制器和地址搜寻数据的传输速度。该专利还谈到了SRAM适合一次写入的大块数据(例如 游戏 安装数据), 游戏 安装一次就行了,更多是在 游戏 中进行读取操作。SSD的读取单元进行了扩展和统一,增加了一个辅助CPU、一个DMAC和一个硬件加速器,保证与主CPU的协同工作和传输速度。
⑻ 数据驱动为什么不等于大数据
数据驱动与大数据无论是从产生背景还是从内涵来说,都具有很大的不同。
一、产生背景不同
21世纪第二个十年,伴随着移动互联网、云计算、大数据、物联网和社交化技术的发展,一切皆可数据化,全球正逐步进入数据社会阶段,企业也存储了海量的数据。在这样的进程中,曾经能获得竞争优势的定位、效率和产业结构均不能保证企业在残酷的商业竞争中保证自身竞争优势,诺基亚,索尼等就是很好的例子。在这样的背景之下,数据驱动产生了,未来谁能更好的由数据驱动企业生产、经营、管理,谁才有可能在残酷的竞争中立于不败之地。
大数据早于数据驱动产生,但是都出于相同的时代,都是在互联网、移动互联网、云计算、物联网之后。随着这些技术的应用,积累了海量的数据,单个数据没有任何价值,但是海量的数据则蕴含着不可估量的价值,通过挖掘、分析,可从中提取出相应的价值,而大数据就是为解决这一类问题而产生的。
由以上分析可知,数据驱动与大数据产生的背景及目的是有差别的,不可以认为数据驱动就是大数据。
二、内涵不同
数据驱动是一种新的运营模式
在传统的商业模式之下,企业通过差异化的战略定位、高效率的经营管理以及低成本优势,可以保证企业在商业竞争中占据有利位置,这些可以通过对流程的不断优化实现,而在移动互联网时代以及正在进入的数据社会时代,这些优势都将不能保证企业的竞争优势,只有企业的数据才能保证企业的竞争优势,也就是说,企业只有由数据驱动才能保证其竞争优势。
在这样的环境之下,传统的经营管理模式都将改变以数据为中心,由数据驱动。数据驱动的企业,这实际上是技术对商业界,对企业界的一个改变。正如王文京总裁所说,消费电子产品经历了一个从模拟走向数字化的革命历程。与此类似,企业的经营管理也将从现有模式转向数据驱动的企业。这样一个转变,实际上也是全球企业面临的一场新变革。
大数据是数据及相关技术工具的统称
大数据目前尚无统一定义, Gartner认为大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。维基网络认为,大数据是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理、处理的数据集合。从产业角度,常常把这些数据与采集它们的工具、平台、分析系统一起被称为“大数据”。大数据具有Volume、VarIEty、Value和VelocITy的4V特征。
数据驱动是一种全新的商业模式,而大数据是海量的数据以及对这些数据进行处理的工具的统称。二者具有本质上的差别,不能一概而论。
数据驱动与大数据有联系
虽然数据驱动与大数据有着众多的不同,但是由上面阐述我们可以知道,数据驱动与大数据不是完全的两码事,二者还是有着一定的联系的。大数据是数据驱动的基础,而数据驱动是大数据的应用体现。
如前所述,数据驱动这样一种商业模式是在大数据的基础上产生的,它需要利用大数据的技术手段,对企业海量的数据进行分析处理,挖掘出这些海量数据的蕴含的价值,从而指导企业进行生产、销售、经营、管理。
同样的,再先进的技术,如果不用于生产时间,则其对于社会是没有太大的价值的,大数据技术应用于数据驱动的企业这样一种商业模式之下,正好体现其应用价值。
⑼ 大数据“掘金”最靠谱的五个领域
大数据“掘金”最靠谱的五个领域
当代著名丹麦物理学家尼尔斯·玻尔(Niels Bohr)曾说:“预测是非常困难的,尤其是对未来的预测。”在科学技术瞬息万变的时代,亦是如此,今日的一个大胆预测,说不定就是明日的已成事实。而对广泛应用技术及市场动向的前瞻性预判,是对当今企业家和高管们的严峻考验,关乎到下一个商业帝国的成败。
此外,预测未来就像是古老的魔法水晶球一样有趣,但是数据的应用并不像发掘那么容易。现在,让我们随着美国互联网私募投资公司Insight Venture Partners总经理Deven Parekh的视角,一同去看看大数据时代将为经济和生活带来哪些新的机遇和挑战。
大数据下的恐怖主义
前段时间引起轩然大波的索尼影业遭黑客攻击事件,是一次明目张胆的国家支持的网络攻击。本文暂不讨论孰是孰非,但在此次事件中,索尼影业的网络系统遭黑客攻击,员工信件、薪酬及电影剧本等信息被泄露,大量公开的内部数据引起了索尼的高度恐慌。
现在每一家《财富》杂志世界2000强企业都在思考:我的公司数据安全吗?如果数据公布于众,将会置我于何地?与此同时,安全软件公司也正致力于大数据分析软件的开发,以帮助企业更好地保护数据安全,避免日后的攻击。
大数据下的公民自由权
数据驱动的决策工具不仅仅应用于商业领域,同时还被广泛用于挑选最合适的学校、医生和雇主。同样,企业也用大数据分析软件来寻找并雇用优秀的员工,或是选择目标客户。但是,倘若上述的一切都是建立在公民隐私权的基础之上呢?大数据的内容会囊括公民的生活方式选择、健康,甚至还有种族、性别或年龄,不是刻意的去侵犯公民隐私,只是为了更好的做出决定呢?目前,所有的学校、公司和公共机构都制定了保护隐私、公平和反歧视的条例,并且有政府的强制实施作为坚强后盾。
大数据时代所带来的不可避免的侵犯隐私权和公民自由权问题正逐渐为世人所知,如何保护公民的这些权利并且跟上日新月异的大数据研究步伐,值得我们深思。
大数据下的政府数据
2015年,期望政府数据更加透明化、实用化。通常,公共部门是私营企业的重要数据来源,政府数据可以让更多的企业将大数据应用于产品及服务中,发挥其最大功能效用。
以旧金山意外天气保险公司Climate Corporation为例,它通过分析气象部门所掌握的海量天气数据来预测未来可能对农业生产造成破坏的各种天气,为农民提供相应的农业保险,以降低恶劣天气对农业生产造成的影响。还有美国房地产信息查询网站Zillow,通过使用联邦政府和当地政府的分析数据,包括卫星照片、税额查定、经济统计数据,为房屋买家提供全面的房地产市场动态。
大数据下的个性化医疗
即使在个人隐私方面还存在较大争论,大数据已然在模糊医疗保健领域的分界线。不论是将其称作“精准医疗”也好,“个性化医疗”也罢,都是将数字化的保健系统和可穿戴设备应用其中,这两大趋势联成一体,正悄然革新健康医疗产业。
在不久的将来,医生将会根据病人的基因组、活动水平和真实健康情况,为患者定制个性化的药物和治疗方式。而此时,普通患者对特定治疗方案数据来源的反应已经显得不重要了,因为没有病人会拒绝最佳治疗方案,即便是以牺牲部分病人隐私权为代价。
医疗信息技术是目前投资的热门领域,但是临床决策还主要是靠医师的临床指南,而不是大数据。在未来,大数据分析很有可能会打破这一局面,彻底改变人类医疗健康行业。
大数据下的数字化学习
美国每年在公共基础教育和高等教育的支出高达1.2万亿美元,但是学生的成绩和表现依然不能达到政策制定者的预期,同时还引发了教育工作者和校方关于教育制度改革的讨论。支持改革者认为教育系统应该引入市场化运作模式,重点突出学生测验、问责制和绩效考核;而反对者却认为应该提升教学工作水平,在教学资源上加大投资力度。
但双方在数字化学习方面却有共同的认识,课堂内外的数字化学习已经是不可阻挡的趋势。从大型在线课程开发到适应性学习技术,都是个性化的将教学材料传输至每一个学生,教学技术凭借大数据环境获得突飞猛进的发展。从熟知的名字到陌生的名词,不断有新的数字产品出现,一改将内容放置网络共享的传统模式,而是从根本上改变学生的学习时间和方式,改变教师指导学生进步的方法。
综上所述,从简单采用到真正开发利用,大数据在五个领域将会发生的深刻变化,又如何助力经济转型与生活变迁,2015年无疑是大数据的爆破之年,让我们拭目以待!
以上是小编为大家分享的关于大数据“掘金”最靠谱的五个领域的相关内容,更多信息可以关注环球青藤分享更多干货
⑽ 大数据面临的技术挑战
上周在大数据的趋势和特点中,说到了人类这次面临的问题不是问题无法解决,而是问题过于复杂。采用机械思维,其速度和效率已经赶不上新问题的产生。正是在这种分工越来越细,协作越来越紧密,问题越来越复杂的背景下,产生了大数据思维。大数据思维也由其独特的体量大、多样性和完备性,使得过去看来很复杂很难处理的问题变得可以解决了。
其实早在20世纪60年代就有研究学者提出采用人工智能的方法来解决社会问题。当时的人工智能方法还是局限于通过首先了解人类是如何产生智能,然后让计算机按照人的思路去做。吴军老师在《智能时代》中说到:“在人类发明的历史上,很多领域早期的尝试都是模仿人或者动物的行为,因为这是我们的直觉最容易想到的方法。” 但是经过十几年的发展,科学家们发现采用上面的思路去发展人工智能,似乎解决不了什么实际问题。很多科学家开始反思人工智能的发展,而在之后的20年左右的时间,在人工智能学术界的研究是处于低谷的。20世纪70年代,人类开始尝试智能的另一条发展道路,即采用数据驱动和超级计算的方法。即便在10年前,那时我还在念书,也曾接触过人工神经网络算法。很显然,当时对机器智能的概念大家都还是比较模糊的,人工智能也还没有被我们提高到现在的高度。
机器智能的概念在60多年就被提出来了,真正的突破却在具有了大数据的今天。为什么大数据的拐点会发生在今天?大数据到底面临何种技术挑战?
过去的10年,最容易看到的特征就是全球数据量呈爆炸式增长。大数据的第一个来源是电脑本身;第二个来源是传感器;第三个来源是将那些过去已经存在的、以非数字化形式储存的信息数字化。据2015年思科公司的统计数据显示,从2009~2015年的6年时间内,企业级数据增长了50倍。当然数据的爆炸式增长,离不开电脑硬件、软件、互联网、数据储存、数据处理等一系列配套技术的发展和支撑。大数据实际上是对计算机科学、电机工程、通信、应用数学和认知科学发展的一个综合考量。目前这些技术难题不一定有最佳的解决方案,甚至不存在什么绝对好的解决办法。
一、数据收集
传统的数据方法常常是先有一个目的,然后开始收集数据。比如,海王星的发现就是在人们发现天王星运动轨迹和牛顿力学预测出来的不一样之后,天文学家拍了很多星空的照片后发现的;心理学研究也是在有了一个明确的研究课题后,再通过实验的方法采集数据,如 “棉花糖测验”系列实验,以及关于认知失调的“追随者案例”等等。大数据则避免了采样之苦,因为大数据常常以全集(大数据的特征之一)作为样本集。
但是,如何收集到全集就是一件很有挑战的事情了。目前一些聪明公司,比如Google, Facebook, 网络,京东都是绕一个弯子,间接地去收集数据,然后利用数据的相关性,导出自己想要的结论。但是即便是这些如此成功的公司,仍然也有很多失败的案例。2010年,Google推出了自己的电视机顶盒Google TV,为了获取数据为进入电视广告做准备。但是,由于Google TV销售得很差,最终Google彻底地放弃了这产品。到目前为止,无论是Google过去的机顶盒,还是后来的Chromecast,苹果的Apple TV,除了统计一下收视率,计算一下可能的广告观众,并没有什么大的作为。数据收集是一个开放性的话题,不存在唯一性或最佳方法,目前仍然面临着很大的挑战。
二、数据储存
仅Google街景地图每天产生的数据量就有1TB,假如一份数据存三个拷贝,一年下来就1PB。即使使用当今最大容量的10TB硬盘,也需要用100个。因此,不能简单地依靠设备来解决数据储存的问题,而是需要技术解决方案来提高储存效率,保证不断产生出来的数据都能存得下。目前的数据储存手段主要是从如下2个方面考虑:去除数据冗余和便于使用。去除数据冗余可以简单理解为去除数据中的重复部分,比如同一份附件在所有的邮件中只储存一次。这样,在去除数据冗余的过程中,相应的数据读写处理就要改变。是否有比现在更有效率的储存格式或方式,仍然是大数据所面临的挑战。另外,便于使用的思路是从使用者的角度就去考虑数据的储存。大数据之前,数据在设计文件系统的数据储存格式时,主要考虑的是规模小、维度少的结构化数据。到了大数据时代,不仅数据量和维度都剧增,而且大数据在形式上也没有固定模式,因此需要重新设计通用、有效和便捷的数据表示方式和储存方式。
三、数据处理
大数据由于体量大、维度多,处理起来计算量巨大,其处理效率是一大技术挑战。并行计算是目前解决计算量巨大的重要手段,但仍然存在一些的问题。例如,任何一个问题总用一部分计算是无法并行计算的,这类计算占比越大,并行处理的效率就越低;再次,并行计算中无法保证每一个小任务的计算量是相同的,这样一来,并行计算的效率也会大打折扣,即完成了自己计算任务的服务器需要等待个别尚未完成的服务器,最终的计算速度取决于最后完成的子任务。
四、数据挖掘
如何从一堆杂乱无章的数据中挖掘出有价值的信息,是机器智能的关键,也是大数据的使命。数据在进行降噪处理之后,基本就可以直接使用了,接下来的关键一步就是机器学习。目前广泛使用的机器学习算法有人工神经网络算法、最大熵模型、逻辑自回归等。Google公司的AlphaGo的训练算法就是人工神经网络。机器学习的过程是一个不断迭代、不断进化的过程,只要事先定出一个目前,这些算法就会不断地优化模型,让它越来越接近真实的情况。寻找更优算法一直也是科学家们探索的难题。
五、数据安全
大数据应用的一个挑战还来自数据安全的担忧和对隐私的诉求。2014年爆出的索尼公司丢失数据时,造成的损失高达1亿美元。比商业数据丢失后损失更大的是医疗数据的被盗。在中国,除了在北京建立了大数据中心,还在贵阳建立了大数据灾备中心,而且正筹备在内蒙古再建立另一个数据灾备中心。而关于数据隐私,我想大家应该是深有感触,由于信息泄露而带来的骚扰电话以及电信诈骗,就发生在我们每个人身上。据《智能时代》中记载:“在美国的黑市上,一个医疗记录的卖家是商业数据的50倍左右”。可见,数据安全已然成为大数据发展的一大隐患和难题。
上述大数据5个方面的技术挑战并不是独立的,而是相辅相成、互相影响的。关于大数据的技术挑战在此仅谈谈个人的一点认识,希望对大家在这方面的思考有所帮助。下周我们继续聊,大数据给我们带来便利以及隐患。