㈠ 首隻大數據中概股IPO,講的什麼故事
2016年9月23日,國雙科技登陸納斯達克,成為中國首家在美股上市的大數據公司。
國雙科技IPO價格回為13美元/股,估值3.7億美元。上市首日,股價上漲21%,當日收盤於15.75美元。國答雙科技首日表現尚可,下一步股價走勢要看市場反饋。
其對標公司HubSpot目前市值20億,IPO價格25美元,IPO當天收於30美元,股價增幅20%;Marketo目前市值16億,IPO價格同為13美元,IPO當天收盤價為23美元,股價暴漲77%
㈡ 大數據時代的幾個關鍵詞是什麼
1、容量(Volume):數據的大小決定所考慮的數據的價值和潛在的信息;
2、種類(Variety):數據類型的多樣性;
3、速度(Velocity):指獲得數據的速度;
4、可變性(Variability):妨礙了處理和有效地管理數據的過程。
5、真實性(Veracity):數據的質量。
6、復雜性(Complexity):數據量巨大,來源多渠道。
7、價值(value):合理運用大數據,以低成本創造高價值。
(2)美股大數據擴展閱讀:
大數據的精髓:
大數據帶給我們的三個顛覆性觀念轉變:是全部數據,而不是隨機采樣;是大體方向,而不是精確制導;是相關關系,而不是因果關系。
A、不是隨機樣本,而是全體數據:在大數據時代,我們可以分析更多的數據,有時候甚至可以處理和某個特別現象相關的所有數據,而不再依賴於隨機采樣(隨機采樣,以前我們通常把這看成是理所應當的限制,但高性能的數字技術讓我們意識到,這其實是一種人為限制);
B、不是精確性,而是混雜性:研究數據如此之多,以至於我們不再熱衷於追求精確度;
之前需要分析的數據很少,所以我們必須盡可能精確地量化我們的記錄,隨著規模的擴大,對精確度的痴迷將減弱;擁有了大數據,我們不再需要對一個現象刨根問底,只要掌握了大體的發展方向即可,適當忽略微觀層面上的精確度,會讓我們在宏觀層面擁有更好的洞察力;
C、不是因果關系,而是相關關系:我們不再熱衷於找因果關系,尋找因果關系是人類長久以來的習慣,在大數據時代,我們無須再緊盯事物之間的因果關系,而應該尋找事物之間的相關關系;相關關系也許不能准確地告訴我們某件事情為何會發生,但是它會提醒我們這件事情正在發生。
㈢ 「大數據」主要涉及哪些領域相關股票分別有哪些
近期,大數據概念正在風靡全球,從華爾街到國內資本市場,大數據概念股持續走強。5月17日,可視化數據分析軟體供應商Tableau 及大數據營銷公司Marketo一登陸美股市場,便引來瘋狂的買盤。截至當日收盤,Marketo的股價飆升77.69%,Tableau的股價也暴漲63.71%。美股對「大數據」概念的瘋狂熱炒很快傳播到了A股市場。今年以來至今,大數據概念股逆市上揚,累計漲幅達47.8%。根據細分行業分類,「大數據」主要涉及七大領域,包括數據處理和分析環節以及綜合處理、語音識別、視頻識別、商業智能軟體、數據中心建設與維護、IT咨詢和方案實施、信息安全等。
相關股票
「大數據」涉及的七大領域之一數據處理、分析環節和綜合處理,與其相關的國內A股上市公司拓爾思和美亞柏科,近期表現搶眼。
語音識別作為「大數據」涉及的七大領域之一,近期,其相關的科大訊飛、大華股份(002236)、華平股份(300074)、中威電子(300270)和國騰電子(300101)等5隻個股受到市場關注。
目前,國內A股市場中涉及視頻識別行業的上市公司主要有5家,具體為:海康威視(002415)、大華股份、華平股份、中威電子、國騰電子。這5隻個股今年以來至今均有不錯表現,大華股份(74.34%)、華平股份(60.34%)、國騰電子(25.49%)、海康威視(22.47%)、中威電子(15.60%)。
目前,A股市場中涉及商業智能軟體生產的上市公司主要有:久其軟體(002279)、用友軟體(600588)、東方國信(300166)。
對於國內企業而言,在大型設備與基礎軟體方面尚無法與全球IT巨頭匹敵。不過,在應用軟體、IT服務的多個細分領域,國內企業已積累了客戶基礎與行業、項目經驗,有望借大數據的興起而獲得增長助力。
值得一提的是,漢得信息是我國本土領先的IT咨詢企業,多年來致力於為企業提供高端ERP實施服務。
三分技術,七分數據,得數據者得天下。隨著未來數據的規模劇增,數據中心的建設與維護是必不可少的。目前A股中涉及數據中心建設與維護的公司包括天璣科技(300245)、銀信科技(300231)和榮之聯(002642)。
目前A股涉及信息安全領域的個股包括:衛士通(002268)、同有科技(300302)、美亞柏科等等。
㈣ 大數據受益股有哪些大數據受益股解析
大數據受益股及解析:(截止年12月)
1:300245:天璣科技:出資1300萬設立合資公司,開展雲計算與大數據相關業務。
2:300170:漢得信息:設立美國全資子公司,從事信息系統和數據管理系統的安裝以及信息系統的集成。
3:002236:大華股份:與阿里雲計算正式簽署戰略合作協議,雙方將圍繞雲計算、大數據技術在視頻監控行業的應用,全面展開合作。
4:300270:中威電子:公司主要產品是數字視頻光端機、VAR光平台、高清攝像機及智能交通產品等,技術涉及圖像視頻智能分析方面,因此被市場列為「大數據」概念股票之一。
5:002230:科大訊飛:購買上海瑞元100%的股權,積極推進公司在大數據業務分析領域的市場,在語音生態圈的基礎上構建大數據分析平台。
6:600804:鵬博士:鵬博士公司未來將以全國50個城市的雲數據中心群為依託形成大數據優勢,在對WIFI進網用戶使用信息分析的基礎上,提供精準的廣告信息推送等應用服務,提升網路廣告價值。
7:600588:用友網路:國內最大的管理軟體廠商用友軟體與微軟、IBM兩大國際IT巨頭合作,合作內容涉及大數據、雲平台合作。
8:300074:華平股份:通過視頻識別,成功進軍「大數據」產業。
9:002279:久其軟體:以「大數據」為主線鏈接集團管控和電子政務兩大傳統主營業務,未來仍能保持穩定增長。
10:000977:浪潮信息:公司以自有資金1,000萬元在廣東省廣州市投資設立全資子公司廣東浪潮大數據研究院有限公司,專業從事伺服器、存儲及大數據相關產品的研發、生產、銷售。
11:002642:榮之聯:與美國數據分析解決方案提供商Alpine簽訂合作關系並獲得其捕獲、存儲、管理和分析「大數據」的原始工具資源。
12:300229:拓爾思:投資設立合資公司有利於推動公司金融大數據行業技術和信息服務業務的拓展,為公司未來向多領域多行業大數據應用業務拓展提供實踐經驗。
13:300188:美亞柏科:全球僅有的電子數據取證行業兩家上市企業之一。
㈤ 銀行數字化轉型加速,潛在風險如何防範業內共識:加強監管!
金融業數字化轉型正銜枚疾進。
這條因新冠肺炎疫情倒逼而來的轉型之路,已由勻速變成加速。而市場需求之迫切,更是超乎想像:數字化轉型,不僅成為近來很多金融論壇的重要議題,一些互聯網銀行以及傳統金融機構金融 科技 方面的負責人,更成為炙手可熱的嘉賓,或專題講座,或網上授課,或論壇演講。而金融 科技 巨頭更是大舉進軍金融業,為數字化轉型需求迫切的金融機構提供 科技 支撐。繼阿里雲加碼「數字農信」戰略,將開放更多智能風控、數據智能經驗和數字生活場景等生態資源,助力農信社、農商銀行等中小銀行形成特有的創新型服務業態後,8月16日,騰訊雲也與崑山農商銀行正式簽署戰略合作協議,雙方將在銀行私有雲平台建設、分布式架構轉型、分布式資料庫應用、移動端開發等金融新基建領域展開合作,同時依託雙方優勢資源,推進零售業務數字化建設以及場景金融創新,構建面向未來金融場景的數字新連接能力。
然而,數字化轉型從來不像人們想像的那樣,將業務從線下搬到線上,就一勞永逸;也不是成立一個金融 科技 部,做幾個銀行APP那麼輕巧。由於涉及金融機構整個內部架構、流程和理念等全方位重構,想要實現真正意義上的數字化轉型,並非易事。這其中,在轉型過程中,如何有效防控未來智能金融的潛在風險,尤其困難。
眾所周知,數字化轉型離不開大數據、雲計算、人工智慧;只有充分發揮技術的力量,才能實現傳統金融向數字化時代智能金融的轉變。利用大數據,金融機構可以構建符合自身實際需求的業務、風控模型;利用雲計算,可以按照模型,進行高效快速運算,將結果用於日常運營;利用人工智慧,可以實現高頻小額貸款的自動發放,實現真正意義上的「秒貸」。可以說,數字化時代的智能金融,顛覆了傳統金融業務模式,省去了大量人工操作過程,極大提升了客戶體驗和滿意度,讓以客戶為中心的經營理念變成了現實。這從頭部民營互聯網銀行每年動輒服務數千萬,甚至上億客戶,發放數千萬筆貸款中可窺見一斑。
不過,硬幣總有兩面。當金融機構享受數字化轉型後的智能金融帶來的便利、高效等好處的同時,潛在的風險也如影隨形。
中國證監會原主席肖鋼日前警告稱,「人工智慧與金融業深度融合的新業態,是金融模式變革的方向,在大力發展的同時亦需要提防可能帶來的系統性風險。」他表示,由於人工智慧主要依靠模型和演算法,因此在該技術運用於金融市場時,一旦數據質量不高或出現偏差,則有可能產生蝴蝶效應,帶來系統性風險。例如,在資本市場上,事先設定的投資模型往往在實施中沒有人為干預,這可能使得投資策略產生高度一致性,並在某個時點上對市場造成沖擊,由此引發系統性風險。美股就曾經出現過「閃電崩盤」,道瓊斯指數在極短時間內暴跌上千點。
雖然肖鋼的觀點,業內早有認知,但在當前金融機構紛紛加大數字化轉型、發展智能金融的大背景下,仍具有振聾發聵的意義。
事實上,業內對智能金融潛在風險認識非常深刻。蘇寧銀行董事長黃金老此前在接受采訪時就表示,通過數字化轉型,金融服務會像水一樣滲透到各個場景各個生態之中,把金融服務或者金融產品內嵌到企業的生產環節、交易環節和個人的生活環節,但這種「滲透」也會帶來新的風險和挑戰。第一大風險是數據風險,這來源於金融的全自動化,要依靠數據來決策。銀行是數據化應用最豐富,或者是最全面的一個領域。如何合理整合這些數據是數字化轉型中銀行的必修課。應對不當,就會產生數據造假、數據中斷、數據泄露、數據濫用等風險。第二大風險是技術風險,既包括演算法的可解釋性和可評估性,比如構造了包含一百個變數的模型來評估貸款是否可以發放,但由誰衡量這個模型是否適當。也涵蓋技術帶來的安全風險,在高度依賴數字化系統的情況下,一旦系統被攻擊或者停擺,可能會對金融安全造成更大的危害。
正因為數據採集來自於人,模型搭建來自於人,因此,智能金融雖然省事,雖然智能,但也會因為數據質量問題和演算法參數設定等問題,潛藏較大風險。如果建立模型的人再有不良用心,潛藏的風險更大。而智能金融一旦發生風險,常常是系統性的。因此,未雨綢繆,做好風險防控工作,非常重要。
如何防範潛在風險?業內共識是,加強監管。
智能金融時代,傳統監管理念和手段,無法有效匹配。因此,金融機構在加速數字化轉型,監管當局的監管手段也應當加速轉換。既然智能金融的風險點潛藏在數據治理和演算法等方面,那麼,監管對象就應當既包含對模型的可解釋性的監管,要讓監管對象能夠解釋清楚模型到底基於何種邏輯;也應包含對智能金融有關模型和演算法的構建者、設計者的監管,為此要及時完善監管制度,堵塞監管盲區,通過資質認定,讓相關從業者具有監管層認可的資質。最重要的是,監管層要有懂行的監管者,要能看得明白,管得到位,治得有效。
㈥ 美國大數據工程師面試攻略
項目數據分析師分享:美國大數據工程師面試攻略
方法/步驟
先做一個自我介紹,本科南開後,加入了一個創業公司kuxun,做實時信息檢索,後來進入網路基礎架構組,搭建了Bai App Engine的早期版本,隨後去Duke大學留學,在攻讀碩士期間,做跟Hadoop大數據相關的研究項目Starfish,之後在Amazon EC2部門實習,了解它們的內部架構,畢業後加入Linkedin,做廣告組的架構,涉及Hadoop調優,Data Pipeline, Offline/Online, 實時系統。最新是在Coursera從事數據工程師工作。在多年工作中,除了對技術的不懈追求,也積累了大量的面試經驗,從國內的一線互聯網網路,阿里巴巴,奇虎,人人,到美國一線公司Facebook,Google,Linkedin,Twitter,Amazon,到熱門Startup,Uber,Pinterest,Airbnb,Box,Dropbox,Snapchat,Houzz,拿到10+ offer,並且在Linkedin期間也面試過100+候選人,參與面試題制定,樂於分享並幫助很多人成功求職,實現目標。
我們看一下這張矽谷地圖,它坐落於美國加州,從聖何塞到舊金山的狹長地帶,中間是San francisco bay,簡稱灣區。它的由來是這邊有計算機核心處理器中離不開的硅,30年來,矽谷就發展成為無數技術性創業公司的搖籃。在20多年前,就有很多硬體公司的輝煌Intel,Oracle,Apple,Cisco成功上市,10年前,互聯網的興起,造就了Yahoo,Google,Ebay的神奇,而如今Tesla,Facebook,Twitter,Linkedin正扶搖直上,成為美股高科技股的領頭羊。這些公司的市值從幾十billion到幾百billion,PE從負數到上千。瘋狂的估值背後也改變了世界。
如果說矽谷成功是有原因的,我覺得有兩點。地理位置是得天獨厚吸引大量人才,這里有Stanford和加州州立高校提供智力庫的支持,在矽谷可以看到來自全世界的最聰明的人,中國人,印度人,猶太人構成這些Engineer的主力。雖然國內做技術自嘲為碼農,但在矽谷成為一個優秀工程師還是收獲頗豐。另一方面創業是一個永恆的話題,在Stanford有個說法空氣中都飄揚中創業的味道,一些早期員工通過上市套現又積累經驗成了天使投資,Y Combinator,各種技術forum,meetup,創業導師,都很活躍。資本的力量功不可沒,早年VC通過投資,收購,上市放大形成一個雪球效應。大家總喜歡問什麼是next big thing,哪一個是下一個facebook,下一個musk,根據統計10年能成就一個千億以上的公司,目前這個進程正在縮短。
我就拿Linkedin作為例子,介紹高科技公司(FLG)是什麼樣子。它是成立2003年的職業社交網站。在10年的發展中,也不是一下子爆發的,目前有3億的全球用戶,雖然跟Facebook,Google 10億+用戶沒法比,但是它有很好的護城河,用戶定位高端精準,單位價值高。這張照片中左邊這位是創始人Reid Hoffman,是Paypal黑幫成員,在矽谷也是呼風喚雨的大佬,目前是董事和投資人。中間這位是CEO Jeff,2013年被Glassdoor評為最佳CEO,作為職業經理人,成功幫助linkedin高速成長,他最喜歡提到transformation,希望我們每個員工能挑戰自我,在各自崗位上進化。Linkedin提供了員工很好的福利,有號稱灣區最佳的免費食堂,每個月一次的in day,hack day, 幫助員工內部創業的incumbator計劃。它特點是數據驅動的開發產品,比如 People you may know, Job you may be interested, 我做過Sponroed Ads 都是需要很強數據背景和data scientist的支持。它的Biz model也很獨特,有3個line,面向公司的招聘服務,面向廣告商的市場服務,面向個人的訂閱服務,還有最新Sales Solution,因為這么多可能性,成為華爾街的寵兒。
說矽谷,除了那些已經成功的大公司,不得不說現在最新的創業動向,這些代表了未來下一個FLG。我總結了一些領域和代表公司:雲計算(box, dropbox),大數據(cloudera),消費互聯網(pinterest),健康(fitbit),通訊(snapchat),支付(square),生活(uber)。 這里是華爾街網站更新的最新融資規模,比如Uber就達到18Billion的估值,我當時拿到offer沒去,還是覺得很瘋狂,如果細看這張表,大家可以看到矽谷(藍色)尤其是舊金山它們的融資規模遠遠大於其他地區,還是地理決定論。而在國內的兩家xiaomi,jingdong都是在北京,而最近大家看到一些泡沫論,說什麼阿里巴巴上市是否美股到頂,經緯VC創始人也提醒我們泡沫的風險,我無法判斷。如果能參與到下一波浪潮裡面去是很過癮的。我推薦大家去看看 <浪潮之巔>,<奇點臨近>,我還是很期待未來20年的技術革命。
我個人熱愛大數據,在矽谷這也是大家津津樂道的,有個笑話,big data is like teenage talking about sex, nobody know how to do it. 其實大家還是興趣驅動就好,不要那麼功利,大數據技術涉及太多,平常工作中也是慢慢積累,有無數的坑和技術細節需要克服。並不是說那個技術最熱就要用哪個,如果你用不好,你的壓力很大的,舉個例子,你用某個開源資料庫,發現它偶爾有數據丟失怎麼辦,如果這是線上服務,你不斷收到報警,這時候你當時選用它的優點 scalable,容錯性都沒意義了。接著說大數據,這裡面Hadoop作為行業標准,我面過的除了Google,微軟不用,幾乎所有的公司都在用,建議大家利用這個機會。這裡面有三巨頭,cloudera是老牌Hadoop咨詢公司,Hadoop的創始人做CTO,Hortonworks也是很多Hadoop的committee,MapR是提出hdfs的erasure 編碼方式高效而著名,它們都是融了巨資,模式也很像,先推出社區免費版,但有個商業版提供更好的管理。 而今年出現一匹黑馬,Spark,簡單說就是內存級別的計算,比Hadoop框架里能節約IO,利用緩存,能適應批處理,迭代,流式計算。
這里看一下它的生態系統,如何學Hadoop是個循序漸進過程,先要理解學習它的core系統,HDFS, MapRece, Common,在外圍有無數的系統工具方便開發,我個人用過的是 Avro作為數據格式,Zookeeper作為選主的高可靠性的組件,Solr作為搜索介面,Pig搭建工作流,Hive 數據倉庫查詢,Oozie管理工作流,HBase 作為KV 分布式存儲,mahout數據挖掘的庫,Cassandra nosql 資料庫。我建議初學的考慮Chinahadoop的課程。
而Hadoop本身也是個進化過程,幾年前0.19版本,到0.20, 0.23分流成Yarn架構最後進化成Hadoop2.0, Hadoop1.0 和 2.0 它們的介面和組件是完全不同的,但總體上Hadoop 2.0 是趨勢,因為它有Yarn這樣分離的資源管理平台,可以以插件的方式開發上面的Application,解放了生產力,而像Spark,Storm這些新型處理器也是支持Hadoop 2.0的。這里是Hortonworks它們提出來的社區版本架構,可以說標準的制定者,一流的公司制定標准,其他的公司一般用只能用它們提供的穩定版,沒有多少話語權。但從事大數據,並不見得是要去這些制定標準的公司,大量的應用也是非常考驗架構的靈活性。並且能看到實際的產品,很有成就感。
說到今年火的,還是要看Spark。從去年至今,已經開了2屆Spark大會,上千人的規模,無數人對比Hadoop 100倍的性能提升而興奮。這里說它的背景是誕生於Berkeley的Amplab,它們有個很有名的BDAS(Berkeley Data Analytics Stack),目前Spark已經成為Apache的頂級項目。去年這個實驗室的教授跟學生出去成立Databricks公司,拉到兩輪上千萬的風投,有人成Spark是Hadoop的終結者嗎?我看今年Spark大會上,所有的Hadoop大佬公司都是鼎力支持,像Cloudrea甚至放棄impala的一線支持而轉變成Spark。如果這么發展下去,星星之火可以燎原啊。它裡面用到Scala是一種函數式語言。裡面的組件也很多,有Shark支持SQL類似Hive,有Spark Streaming,MLlib,Graphx,SparkR,BlinkDB。它的核心數據結構是RDD,可以跑在各種分布式系統上。總體上是個包容性+侵略性的系統。我個人也很看好它們的發展。