A. 未來24個月,機器學習領域將可能有哪些重大突破
近日,卡內基梅隆大學(CMU)計算機學院院長Andrew W. Moore和副院長Philip L. Lehman來到微軟亞洲研究院,與研究員們分享了過去兩年中人工智慧領域的一些技術突破,並從業界和學界兩個角度,探討了他們對於人工智慧接下來發展方向的看法。
今天,我們就在這里與大家分享此次演講~以下為Andrew W. Moore演講的精簡版文字整理。
2005到2015年間,我們見證了數據科學在學術界和商業界的發展,學會了如何正確地使用分布式計算、GPU,如何很快的建立抽象模型等等。彷彿AI完全轉化成了機器學習,每個人都在處理數據、基於數據為復雜的世界建模……
大約2014年,許多人開始意識到這些工作還遠遠不夠,它們僅能實現改變世界藍圖的一半,而另一半則是被我們視為數據科學最頂層的決策系統。上世紀90年代,我們對所建立的系統都十分樂觀。但漸漸地,我們發現,這些系統在應用到實際生活中時並沒有效果,比如在優化城市交通數據時,一個完美的優化演算法並沒有幫助,因為那時我們沒有任何關於城市交通的數據。所以現在,我們嚴肅認真地考慮重新回到基於數據科學的大規模優化和決策上。
而在大學里,我們會思考更多的可能性。有些教授認為自主性(autonomy)是最重要的,是AI的真正目標,對此觀點我們十分尊重。它在很多方面,比如深空探索或需要快速決策的情況下,都將有重要的應用。當然,自主性不是AI最終唯一的目標。它還包括其他方面,例如增強人類(augmented humans)等等,在我看來這和微軟的核心任務,如何更好地幫助人類工作、生活,有著很大的重合度。我們需要幫助人類更好地工作、生活,同時也需要自主性。
在數據科學方面,我們需要關注三個部分。首先是人工智慧的基礎建設,包括大型優化策略,它需要我們擅長大規模線性規劃問題和隨機梯度下降等問題。其次,是自主性(autonomy),最後是增強人類(augmented humans)。
Andrew W. Moore是卡內基梅隆大學(CMU)計算機學院的第十五位院長。他的研究領域主要有統計機器學習、人工智慧、機器人技術以及大數據統計計算。他曾在機器人控制、製造、強化學習、天體物理演算法、電子商務領域都有所建樹。他的數據挖掘教程下載量已達100多萬。他建立了Auton Lab研究組,該研究組設計了有效的關於大型統計操作的新方法,並在多種情況下都實現了幾個數量級的加速效果。Auton研究組的成員與許多科學家、政府機構、技術公司都有著密切的合作,旨在不斷尋求在計算、統計數據挖掘、機器學習和人工智慧領域中最函待解決的問題。2006年,Andrew加入谷歌,參與Google Pittsburgh的建立。同時,他也參與了包括Google Sky和Android SkyMap的相關事宜。2014年8月,Andrew重返卡內基梅隆大學(CMU),繼續擔任計算機學院院長。
B. 大數據支撐人工智慧發展 應用爆發將迎拐點
大數據支撐人工智慧發展 應用爆發將迎拐點
隨著大數據等技術發展,人工智慧應用令人矚目。有專家認為,這是20年來全球最重要的科技,並將成為工業機器人、無人機、無人駕駛等新興產業的重要基礎。
人工智慧應用爆發
記者從微軟亞洲互聯網工程研究院獲悉,微軟人工智慧機器人「小冰」即將登陸屏幕,成為上海廣播電視台東方衛視早間一檔新聞直播節目的「主持人」。
人工智慧已成為當今學術界、產業界,甚至是社會上火熱的話題。全球科技領域預言家、《失控》作者凱文.凱利日前表示,未來20年全球最重要的技術是人工智慧。
華安證券認為,「互聯網+」概念中,隨著人工智慧技術的發展,可以看到利用互聯網技術與人工智慧自動化技術的深度融合將成為新的高精尖科技領域。
微軟亞洲互聯網工程研究院院長王永東坦言,人工智慧發展一開始發展緩慢,但這一兩年隨著互聯網發展,積累了許多數據,讓普通用戶貢獻數據成為可能,以大數據和雲計算的基礎,對人工智慧的發展起到極大促進作用,將從前以演算法為主的模式發展到「演算法+大數據」結合的發展模式。搜索引擎和大數據技術是人工智慧發展的基礎。
投資大幅增加
發達國家已充分認識到人工智慧的戰略意義,紛紛從國家層面加大投入。比如,美國國防部、歐盟在近年以資金或項目的方式支持人工智慧技術的發展。
外國科技巨頭也加速在人工智慧領域的投資和研發。有資料顯示,截至2014年4月,谷歌已斥巨資收購了包括波士頓動力公司在內的多家機器人公司,還不惜重金收購代表人工智慧發展方向的深度學習神經網路技術公司。臉書在2013年底宣布成立新的人工智慧實驗室,宣稱要給人工智慧帶來重大突破,15億用戶所產生的數據和搜索技術成為其發展人工智慧的基礎。微軟也是較早研究人工智慧的企業,除了布局深度學習之外,微軟還在軟體層面加強了人工智慧的應用和基礎研究,並基於必應搜索技術以Windows10為入口直接推出了面向公眾的人工智慧產品小冰和小娜。
微軟亞洲互聯網工程研究院資深總監、「小冰」項目負責人李笛直言,人工智慧投入巨大,微軟進行了大量技術積累,未來將會提供人工智慧的基礎服務,再接入上下游相對應的垂直行業,形成一種新的行業或矩陣。
特斯拉CEO伊隆.馬斯克最近宣布,將和多位矽谷投資人發起OpenAI人工智慧項目,該項目獲得了10億美元投資。
發展迎拐點
我國科技企業在人工智慧領域的研發和人才等方面的投入不斷加大,人工智慧領域的技術儲備和積累與先進國家企業的差距不斷縮小。據網路介紹,其已建成全球最大的深度神經網路,包含200億個參數,在人工智慧多個應用領域達到世界領先水平。
業內人士和專家認為,人工智慧技術將極大提升和擴展人類的能力邊界,對促進技術創新、提升國家競爭優勢,乃至推動人類社會發展產生深遠影響。當前,人工智慧技術的發展已迎來拐點。
從宏觀層面看,由於人工智慧技術與互聯網密切相關,而互聯網的「泛在化」使其正在滲透進生產生活的各個角落,因此人工智慧技術對於人類社會的影響將是全面而深遠的。無論是機器人、無人飛機,還是其他智能設備,都需有強大的人工智慧系統作為核心技術支撐。
從微觀層面看,人工智慧有著改變操作系統、互聯網入口乃至各種傳統產品的潛能。微軟全球副總裁陸奇說,通過聽覺和基於大數據和用戶個性化研究,將極大提升用戶體驗和獲取信息的方式。比如,作為操作系統層面上的人工智慧,微軟人工智慧助手「小冰」背後不僅可以連接整個互聯網的大數據,更能將來自合作夥伴的信息、服務和產品囊括其中,實現人工智慧入口的價值。
未來人工智慧的商業化潛力巨大。陸奇認為,從商業角度看人工智慧的發展具有顛覆性,很多商業模式和新的需求行為將隨之形成。同時,人工智慧也是具有顯著產業溢出效應的基礎性技術,能夠推動多個領域的變革和跨越式發展。
網路公司CEO李彥宏認為,人工智慧可以加速發現醫治疾病的新療法,降低新葯研發成本,促進醫療產業的創新;可帶動工業機器人、無人駕駛汽車等新興產業的發展,將成為新一輪工業革命的推動器。
「目前,可說是介入人工智慧的較好時機。」李笛說,「人工智慧投入巨大,需要深入的積累,未來人工智慧可能會形成產業鏈,但現在還處於雛形。」
李彥宏建議,國家需將傳統「相馬模式」的科研機制,轉變為「賽馬模式」的市場機制,吸引相關各方的廣泛參與。
同時,盡快搭建人工智慧基礎資源和公共服務平台,支撐各計劃參與方的數據調用、模型調試和應用開發,高效對接全社會的智力、數據、技術和計算資源,依託統一平台實現資源共享,促進研發創新。
C. 大數據告訴你:學霸是怎樣煉成的!
大數據告訴你:學霸是怎樣煉成的!
近日,國內大數據領域領軍專家、電子科技大學周濤教授與有著近十年學工部長教育 經驗 的呂紅胤研究員,花費了近大半年的時間,聯合研發出一套「大數據」系統——「學生畫像」。
該系統利用校園一卡通追蹤學生行為軌跡,通過對學生吃飯、打水、出行、消費行為記錄,「算」出每名學生的 學習 、生活狀態。更厲害的是,通過對學生日常學習狀態的追蹤,該系統還會對學生的期末成績乃至 大學四年 後的 就業 情況作出預警——
註:系統用排名均值來計量學生成績的優異。排名均值=學生在所在專業的年級排名/本專業的總人數,排名均值越接近0,代表該學生的成績越好。
學霸是如何煉成的?
學霸出門時間通常比較固定
研究人員分析了近半年的 宿舍 門禁、吃飯、進出圖 書 館等刷卡記錄,發現成績較好的學生作息時間比成績差的更規律。
例如,某 專業排名 第3的小雪,幾乎每天固定在8點、12點、14點三個時間點出門,留在宿舍的總時長低於專業平均水平。而該專業成績排名第61的小石每天進出宿舍的時間很隨機,而且通常每次外出的時長不超過2小時,「宅指數」明顯高於專業平均水平。
此外,研究人員還發現,9點前出現在食堂吃早餐的同學,成績也相對更好。
學霸最愛在晚上10-11點洗澡
上圖中,橫軸代表了時間點,豎軸則代表了在當前的時間點下,學生的洗澡概率。電子科大的澡堂是全天開放的,但研究團隊發現,晚上10——11點,學習好的學生與學習差的學生洗澡概率出現了較大的差異。簡言之,集中在晚上10到11點之間洗澡的學生成績更優異。
不管是出門時間還是洗澡時間,抑或是相對固定的早餐時間,都是學生作息規律的具體體現。研究人員發現,較有規律的學生群體,除了成績上的優勢外, 考研 成功 率以及 出國留學 獲得獎學金的概率均高於一般學生。這也從側面印證了生活的規律性對於成績有正面影響的結論。
學霸愛泡圖書館和自習室
在樣本量足夠龐大的情況下,學生在一定時期內的行為追蹤確實可以反映他的學習和生活狀態。比如,如果一個學生的打卡記錄顯示,他長期在教學樓的飲水機上打水,那一定程度上就說明了,教學樓是他的長期活動地點。
「學生畫像」的研究團隊,通過大數據分析,發現了出入圖書館次數多少與學習成績的好壞存在著一定的相關性,即:出入圖書館次數比較多的學生,成績要仔碼優於出入圖書館次數比較少的學生。同一個學生,隨著他出入圖書館次數的增多或減少,他的成績排名在上銷戚仔下浮動。如圖↓↓
這樣的相關性,同樣適用於學校的教學樓↓↓(註:在教室打水代表該學生出現在了教學樓~)
學霸也扎推?
現實中,每個人都會受到種種環境的影響。無疑,處於校園之中,身邊人的學習狀態,自然也會影響到學生自身的成績好壞。
研究團隊發現,如果一個 大學生 ,他身邊的朋友成績比較好,那他自身的成績也相對較好!
想要成為一枚學霸?先找個學霸好友吧——
期末會不會掛科?算一下吧
在這項研究中,研究團隊專門設計出了一系列輔助學生更好完成大學學業的功能模塊——「掛科預警」。
想知道你學期末會不會掛科?那就算一算嘍!
掛科率= 努力 程度 + 學習基礎;
努力程度依據:教學樓打水頻率+進出圖書館的時間與次數;
學習基礎:用已考科目成績、已考與將考科目之間的關聯性算出;
一旦你的掛科率觸碰到了預警紅線,那系統便會自動為負責你學習的輔導員推送預警信息!
「前方高能預警,您的掛科率有偏高趨勢,請好好學習——」自從有了「掛科預警」系統,媽媽再也不用擔心我掛科了——
四年後,你會成為失業大軍中的一員嗎?
如今,就業形勢一年比一年緊張。作為學生,你在擔心 畢業 即失業?作為高校的管理者,你會困惑於如何幫虧汪助學生突破重圍嗎?嗯,好消息來了!
「學生畫像」研究團隊通過大量的數據分析,研究得出了一個學生的畢業去向與他在校期間的生活規律有著一定的關聯性。
電子科技大學教育大數據研究所副所長、原微軟亞洲研究院的連德富教授在接受中國青年報(ID:zqbcyol)采訪時表示,通過對比往屆 畢業生 的畢業去向,他們發現,就業困難學生群體身上確實存在某些相似的行為特徵。比如,與其他同學相比,就業困難學生在校期間的生活普遍不太規律。此外,就業困難學生在圖書館的借閱書目也更偏向於懸疑科幻小說以及與游戲相關的 書籍 。
近年來,越來越多的大學生畢業後選擇 創業 。麥可思研究院研究發現,包括本科畢業生和高職專院校畢業生在內的中國大學生畢業後選擇自主創業的比例基本呈逐年上升的趨勢:2007年1.2%,2008年1%,2009年1.2%,2010年1.5%,2011年1.6%,2012年2%,2013年2.3%,2014年2.9%。
在連德富教授看來,大學里的創業一族也有「大數據」特點。偏好創業的學生跑市區的頻率要高於普通學生。