未至科技魔方是一款大數據模型平台,是一款基於服務匯流排與分布式雲計算兩大技術架構的一款數據分析、挖掘的工具平台,其採用分布式文件系統對數據進行存儲,支持海量數據的處理。採用多種的數據採集技術,支持結構化數據及非結構化數據的採集。通過圖形化的模型搭建工具,支持流程化的模型配置。通過第三方插件技術,很容易將其他工具及服務集成到平台中去。數據分析研判平台就是海量信息的採集,數據模型的搭建,數據的挖掘、分析最後形成知識服務於實戰、服務於決策的過程,平台主要包括數據採集部分,模型配置部分,模型執行部分及成果展示部分等。
未至科技小蜜蜂網路信息雷達是一款網路信息定向採集產品,它能夠對用戶設置的網站進行數據採集和更新,實現靈活的網路數據採集目標,為互聯網數據分析提供基礎。
未至科技泵站是一款大數據平台數據抽取工具,實現db到hdfs數據導入功能,藉助Hadoop提供高效的集群分布式並行處理能力,可以採用資料庫分區、按欄位分區、分頁方式並行批處理抽取db數據到hdfs文件系統中,能有效解決大數據傳統抽取導致的作業負載過大抽取時間過長的問題,為大數據倉庫提供傳輸管道。
未至科技雲計算數據中心以先進的中文數據處理和海量數據支撐為技術基礎,並在各個環節輔以人工服務,使得數據中心能夠安全、高效運行。根據雲計算數據中心的不同環節,我們專門配備了系統管理和維護人員、數據加工和編撰人員、數據採集維護人員、平台系統管理員、機構管理員、輿情監測和分析人員等,滿足各個環節的需要。面向用戶我們提供面向政府和面向企業的解決方案。
未至科技顯微鏡是一款大數據文本挖掘工具,是指從文本數據中抽取有價值的信息和知識的計算機處理技術,
包括文本分類、文本聚類、信息抽取、實體識別、關鍵詞標引、摘要等。基於Hadoop
MapRece的文本挖掘軟體能夠實現海量文本的挖掘分析。CKM的一個重要應用領域為智能比對,
在專利新穎性評價、科技查新、文檔查重、版權保護、稿件溯源等領域都有著廣泛的應用。
未至科技數據立方是一款大數據可視化關系挖掘工具,展現方式包括關系圖、時間軸、分析圖表、列表等多種表達方式,為使用者提供全方位的信息展現方式。
❷ 大數據分析一般用什麼工具分析
今天就我們用過的幾款大數據分析工具簡單總結一下,與大家分享。
1、Tableau
這個號稱敏捷BI的扛把子,魔力象限常年位於領導者象限,界面清爽、功能確實很強大,實至名歸。將數據拖入相關區域,自動出圖,圖形展示豐富,交互性較好。圖形自定義功能強大,各種圖形參數配置、自定義設置可以靈活設置,具備較強的數據處理和計算能力,可視化分析、互動式分析體驗良好。確實是一款功能強大、全面的數據可視化分析工具。新版本也集成了很多高級分析功能,分析更強大。但是基於圖表、儀錶板、故事報告的邏輯,完成一個復雜的業務匯報,大量的圖表、儀錶板組合很費事。給領導匯報的PPT需要先一個個截圖,然後再放到PPT裡面。作為一個數據分析工具是合格的,但是在企業級這種應用匯報中有點局限。
2、PowerBI
PowerBI是蓋茨大佬推出的工具,我們也興奮的開始試用,確實完全不同於Tableau的操作邏輯,更符合我們普通數據分析小白的需求,操作和Excel、PPT類似,功能模塊劃分清晰,上手真的超級快,圖形豐富度和靈活性也是很不錯。但是說實話,畢竟剛推出,系統BUG很多,可視化分析的功能也比較簡單。雖然有很多復雜的數據處理功能,但是那是需要有對Excel函數深入理解應用的基礎的,所以要支持復雜的業務分析還需要一定基礎。不過版本更新倒是很快,可以等等新版本。
3、Qlik
和Tableau齊名的數據可視化分析工具,QlikView在業界也享有很高的聲譽。不過Qlik Seanse產品系列才在大陸市場有比較大的推廣和應用。真的是一股清流,界面簡潔、流程清晰、操作簡單,交互性較好,真的是一款簡單易用的BI工具。但是不支持深度的數據分析,圖形計算和深度計算功能缺失,不能滿足復雜的業務分析需求。
最後將視線聚焦國內,目前搜索排名和市場宣傳比較好的也很多,永洪BI、帆軟BI、BDP等。不過經過個人感覺整體宣傳大於實際。
4、永洪BI
永洪BI功能方面應該是相對比較完善的,也是拖拽出圖,有點類似Tableau的邏輯,不過功能與Tableau相比還是差的不是一點半點,但是操作難度居然比Tableau還難。預定義的分析功能比較豐富,圖表功能和靈活性較大,但是操作的友好性不足。宣傳擁有高級分析的數據挖掘功能,後來發現就集成了開源的幾個演算法,功能非常簡單。而操作過程中大量的彈出框、難以理解含義的配置項,真的讓人很暈。一個簡單的堆積柱圖,就研究了好久,看幫助、看視頻才搞定。哎,只感嘆功能藏得太深,不想給人用啊。
5、帆軟BI
再說號稱FBI的帆軟BI,帆軟報表很多國人都很熟悉,功能確實很不錯,但是BI工具就真的一般般了。只能簡單出圖,配合報表工具使用,能讓頁面更好看,但是比起其他的可視化分析、BI工具,功能還是比較簡單,分析的能力不足,功能還是比較簡單。帆軟名氣確實很大,號稱行業第一,但是主要在報表層面,而數據可視化分析方面就比較欠缺了。
6、Tempo
另一款工具,全名叫「Tempo大數據分析平台」,宣傳比較少,2017年Gartner報告發布後無意中看到的。是一款BS的工具,申請試用也是費盡了波折啊,永洪是不想讓人用,他直接不想賣的節奏。
第一次試用也是一臉懵逼,不知道該點那!不過抱著破罐子破摔的心態稍微點了幾下之後,操作居然越來越流暢。也是拖拽式操作,數據可視化效果比較豐富,支持很多便捷計算,能滿足常用的業務分析。最最驚喜的是它還支持可視化報告導出PPT,徹底解決了分析結果輸出的問題。深入了解後,才發現他們的核心居然是「數據挖掘」,演算法十分豐富,也是拖拽式操作,我一個文科的分析小白,居然跟著指導和說明做出了一個數據預測的挖掘流,簡直不要太驚喜。掌握了Tempo的基本操作邏輯後,居然發現他的易用性真的很不錯,功能完整性和豐富性也很好。
❸ 數據爬蟲行為如何合規
前言
由於網路數據爬取行為具有高效檢索、批量復制且成本低廉的特徵,現已成為許多企業獲取數據資源的方式。也正因如此,一旦爬取的數據設計他人權益時,企業將面臨諸多法律風險。本文將從數據爬取行為的相關概述、數據爬取相關立法規定,結合數據爬取行為近期典型案例,探討數據爬取行為的合規要點。
一、數據爬取行為概述
數據爬取行為是指利用網路爬蟲或者類似方式,根據所設定的關鍵詞、取樣對象等規則,自動地抓取萬維網信息的程序或者腳本,並對抓取結果進行大規模復制的行為。
使用爬蟲爬取數據的過程當中,能否把握合法邊界是關系企業生死存亡的問題。近些年大數據、人工智慧的廣泛使用,對各種數據的剛性需求,使數據行業遊走在「灰色邊緣」。面對網路數據安全的「強監管」態勢,做好數據合規、數據風控刻不容緩。當前我國並沒有相關法律法規對數據爬取行為進行專門規制,而是根據爬取數據的不同「質量」,主要通過《中華人民共和國著作權法》(以下簡稱「《著作權法》)、《中華人民共和國反不正當競爭法》(以下簡稱「《反不正當競爭法》」)、《中華人民共和國刑法》(以下簡稱「《刑法」》)等現有法律法規進行規制。
二、數據爬取相關法律責任梳理
(一)承擔刑事責任
1、非法侵入計算機信息系統罪
《刑法》第285條第1款規定了「非法侵入計算機信息系統罪」,違反國家規定,侵入國家事務、國防建設、尖端科學技術領域的計算機信息系統的,處三年以下有期徒刑或者拘役。
典型案例:李某等非法侵入計算機信息系統罪(2018)川3424刑初169號
本案中,被告人李某使用「爬蟲」軟體,大量爬取全國各地及涼山州公安局交警支隊車管所公告的車牌放號信息,之後使用軟體採用多線程提交、批量刷單、驗證碼自動識別等方式,突破系統安全保護措施,將爬取的車牌號提交至「交通安全服務管理平台」車輛報廢查詢系統,進行對比,並根據反饋情況自動記錄未注冊車牌號,建立全國未注冊車牌號資料庫。之後編寫客戶端查詢軟體,由李某通過QQ、淘寶、微信等方式,以300-3000元每月的價格,分省市販賣資料庫查閱許可權。
法院認為,被告人李文某為牟取私利,違法國家規定,侵入國家事務領域的計算機信息系統,被告人的行為均已構成非法侵入計算機信息系統罪。
2、非法獲取計算機信息系統數據罪
《刑法》第285條第2款規定如下,違反國家規定,侵入前款規定以外的計算機信息系統或者採用其他技術手段,獲取該計算機信息系統中存儲、處理或者傳輸的數據,或者對該計算機信息系統實施非法控制,情節嚴重的,處三年以下有期徒刑或者拘役,並處或者單處罰金;情節特別嚴重的,處三年以上七年以下有期徒刑,並處罰金。同時,《最高人民法院、最高人民檢察院關於辦理危害計算機信息系統安全刑事案件應用刑事案件應用法律若干問題的解釋》第1條對「情節嚴重」作出了具體的規定:「非法獲取計算機信息系統數據或者非法控制計算機信息系統,具有下列情形之一的,應當認定為刑法第二百八十五條第二款規定的「情節嚴重」:(一)獲取支付結算、證券交易、期貨交易等網路金融服務的身份認證信息十組以上的;(二)獲取第(一)項以外的身份認證信息五百組以上的;(三)非法控制計算機信息系統二十台以上的;(四)違法所得五千元以上或者造成經濟損失一萬元以上的;(五)其他情節嚴重的情形。」
典型案例:李某、王某等非法獲取計算機信息系統數據、非法控制計算機系統案(2021)滬0104刑初148號
本案中,益采公司在未經淘寶(中國)軟體有限公司授權許可的情況下,經李某授意,益采公司部門負責人被告人王某、高某等人分工合作,以使用IP代理、「X-sign」簽名演算法等手段突破、繞過淘寶公司的「反爬蟲」防護機制,再通過數據抓取程序大量非法抓取淘寶公司存儲的各主播在淘寶直播時的開播地址、銷售額、觀看PV、UV等數據。至案發,益采公司整合非法獲取的數據後對外出售牟利,違法所得共計人民幣22萬余元。法院認為被告人李某、王某、高某等人構成非法獲取計算機信息系統數據罪,分別判處有期徒刑二年六個月、一年三個月不等,並處罰金。
法院認為,被告人李文某為牟取私利,違法國家規定,侵入國家事務領域的計算機信息系統,被告人的行為均已構成非法侵入計算機信息系統罪。
3、提供侵入、非法控制計算機信息系統程序、工具罪
《刑法》第285條第3款對該罪規定如下,提供專門用於侵入、非法控制計算機信息系統的程序、工具,或者明知他人實施侵入、非法控制計算機信息系統的違法犯罪行為而為其提供程序、工具,情節嚴重的,依照前款的規定處罰。《最高人民法院、最高人民檢察院關於辦理危害計算機信息系統安全刑事案件應用刑事案件應用法律若干問題的解釋》中還列舉了「具有避開或者突破計算機信息系統安全保護措施,未經授權或者超越授權獲取計算機信息系統數據的功能的」等類型的程序、工具。
典型案例:陳輝提供侵入、非法控制計算機信息系統程序、工具罪(2021)粵0115刑初5號
本案中,被告人陳輝為牟取非法利益,在本區編寫爬蟲軟體用於在浙江淘寶網路有限公司旗下的大麥網平台上搶票,並以人民幣1888元到6888元不等的價格向他人出售該軟體,非法獲利人民幣12萬余元。2019年7月11日,被告人陳輝被公安機關抓獲。經鑒定,上述爬蟲軟體具有以非常規的方式構造和發送網路請求,模擬用戶在大麥網平台手動下單和購買商品的功能;具有以非常規手段模擬用戶識別和輸入圖形驗證碼的功能,該功能可繞過大麥網平台的人機識別驗證機制,以非常規方式訪問大麥網平台的資源。
本院認為,被告人陳輝提供專門用於侵入、非法控制計算機信息系統程序、工具,情節特別嚴重,依法應予懲處。
4、 侵犯公民個人信息罪
《刑法》第253條中規定了該罪,違反國家有關規定,向他人出售或者提供公民個人信息,情節嚴重的,處三年以下有期徒刑或者拘役,並處或者單處罰金;情節特別嚴重的,處三年以上七年以下有期徒刑,並處罰金。違反國家有關規定,將在履行職責或者提供服務過程中獲得的公民個人信息,出售或者提供給他人的,依照前款的規定從重處罰。竊取或者以其他方法非法獲取公民個人信息的,依照第一款的規定處罰。
典型案例:杭州魔蠍數據 科技 有限公司、周江翔、袁冬侵犯公民個人信息罪(2020)浙0106刑初437號
本案中,被告人周江翔系魔蠍公司法定代表人、總經理,負責公司整體運營,被告人袁冬系魔蠍公司技術總監,系技術負責人,負責相關程序設計。魔蠍公司主要與各網路貸款公司、小型銀行進行合作,為網路貸款公司、銀行提供需要貸款的用戶的個人信息及多維度信用數據,方式是魔蠍公司將其開發的前端插件嵌入上述網貸平台A**中,在網貸平台用戶使用網貸平台的APP借款時,貸款用戶需要在魔蠍公司提供的前端插件上,輸入其通訊運營商、社保、公積金、淘寶、京東、學信網、徵信中心等網站的賬號、密碼,經過貸款用戶授權後,魔蠍公司的爬蟲程序代替貸款用戶登錄上述網站,進入其個人賬戶,利用各類爬蟲技術,爬取(復制)上述企、事業單位網站上貸款用戶本人賬戶內的通話記錄、社保、公積金等各類數據。
法院認為,被告單位杭州魔蠍數據 科技 有限公司以其他方法非法獲取公民個人信息,情節特別嚴重,其行為已構成侵犯公民個人信息罪。被告人周江翔、袁冬分別系對被告單位魔蠍公司侵犯公民個人信息行為直接負責的主管人員和其他直接責任人員,其行為均已構成侵犯公民個人信息罪。
5、侵犯著作權罪
根據《刑法》第217條規定,以營利為目的,有下列侵犯著作權或者與著作權有關的權利的情形之一,違法所得數額較大或者有其他嚴重情節的,處三年以下有期徒刑,並處或者單處罰金;違法所得數額巨大或者有其他特別嚴重情節的,處三年以上十年以下有期徒刑,並處罰金:(一)未經著作權人許可,復制發行、通過信息網路向公眾傳播其文字作品、音樂、美術、視聽作品、計算機軟體及法律、行政法規規定的其他作品的;(二)出版他人享有專有出版權的圖書的;(三)未經錄音錄像製作者許可,復制發行、通過信息網路向公眾傳播其製作的錄音錄像的;(四)未經表演者許可,復制發行錄有其表演的錄音錄像製品,或者通過信息網路向公眾傳播其表演的;(五)製作、出售假冒他人署名的美術作品的;(六)未經著作權人或者與著作權有關的權利人許可,故意避開或者破壞權利人為其作品、錄音錄像製品等採取的保護著作權或者與著作權有關的權利的技術措施的。
典型案例:譚某某等侵犯著作權罪(2020)京0108刑初237號
本案中,被告鼎閱公司自2018年開始,在覃某某等12名被告人負責管理或參與運營下,未經掌閱 科技 股份有限公司、北京幻想縱橫網路技術有限公司等權利公司許可,利用網路爬蟲技術爬取正版電子圖書後,在其推廣運營的「鴻雁傳書」「TXT全本免費小說」等10餘個App中展示,供他人訪問並下載閱讀,並通過廣告收入、付費閱讀等方式進行牟利。根據經公安機關依法提取收集並經勘驗、檢查、鑒定的涉案侵權作品信息數據、賬戶交易明細、鑒定結論、廣告推廣協議等證據,法院查明,涉案作品侵犯掌閱 科技 股份有限公司、北京幻想縱橫網路技術有限公司享有獨家信息網路傳播權的文字作品共計4603部,侵犯中文在線數字出版集團股份有限公司享有獨家信息網路傳播權的文字作品共計469部。
法院認為,鼎閱公司、直接負責的主管人員覃某某等12名被告人以營利為目的,未經著作權人許可,復制發行他人享有著作權的文字作品,情節特別嚴重,其行為均已構成侵犯著作權罪,應予懲處。
(2) 構成不正當競爭
我國《反不正當競爭法》第12條規定:「經營者利用網路從事生產經營活動,應當遵守本法的各項規定。經營者不得利用技術手段,通過影響用戶選擇或者其他方式,實施下列妨礙、破壞其他經營者合法提供的網路產品或者服務正常運行的行為:(一)未經其他經營者同意,在其合法提供的網路產品或者服務中,插入鏈接、強制進行目標跳轉;(二)誤導、欺騙、強迫用戶修改、關閉、卸載其他經營者合法提供的網路產品或者服務;(三)惡意對其他經營者合法提供的網路產品或者服務實施不兼容;(四)其他妨礙、破壞其他經營者合法提供的網路產品或者服務正常運行的行為。
典型案例:深圳市騰訊計算機系統有限公司、騰訊 科技 (深圳)有限公司與被告某新媒體公司不正當競爭糾紛案
本案中,兩原告系微信公眾平台的經營者和管理者,被告某新媒體公司系某網站經營者,利用爬蟲技術抓取微信公眾平台文章等信息內容數據,並通過網站對外提供公眾號信息搜索、導航及排行等數據服務。原告訴稱,被告利用被控侵權產品,突破微信公眾平台的技術措施進行數據抓取,並進行商業化利用,妨礙平台正常運行,構成不正當競爭。被告辯稱,爬取並提供公眾號數據服務的行為不構成不正當競爭,其爬取的文章並非騰訊公司的數據,而是微信公眾號的用戶數據,且其網站獲利較少。
法院認為,被告違背誠實信用原則,擅自使用原告徵得用戶同意、依法匯集且具有商業價值的數據,並足以實質性替代其他經營者提供的部分產品或服務,損害公平競爭的市場秩序,屬於《反不正當競爭法》第十二條第二款第四項所規定的妨礙、破壞其他經營者合法提供的網路產品或者服務正常運行的行為,構成不正當競爭。
(3) 行政責任
我國當前關於爬蟲行為所應承擔的行政責任主要規定在《網路安全法》中,其中涉嫌違反第27條規定的:「任何個人和組織不得從事非法侵入他人網路、干擾他人網路正常功能、竊取網路數據等危害網路安全的活動;不得提供專門用於從事侵入網路、干擾網路正常功能及防護措施、竊取網路數據等危害網路安全活動的程序、工具;明知他人從事危害網路安全的活動的,不得為其提供技術支持、廣告推廣、支付結算等幫助。」,需要承擔一定的行政責任。該法第63條對違反第27條還規定了具體的行政處罰措施,包括「沒收違法所得」「拘留」「罰款」等處罰。同時,對違反27條規定受到處罰的相關人員也作出了任職限制規定。
此外,《數據安全管理辦法(徵求意見稿)》第16條對爬蟲適用作出了限流規定:「網路運營者採取自動化手段訪問收集網站數據,不得妨礙網站正常運行;此類行為嚴重影響網站運行,如自動化訪問收集流量超過網站日均流量三分之一,網站要求停止自動化訪問收集時,應當停止。」同時,第37條也規定了相應的行政責任:網路運營者違反相關規定的,由有關部門給予公開曝光、沒收違法所得、暫停相關業務、停業整頓、關閉網站、吊銷相關業務許可證或吊銷營業執照等處罰。
三、數據爬取行為的合規指引
(一)嚴格規范數據爬取行為
1、如果目標網站有反爬取協議,應嚴格遵守網站設置的 Robots協議。Robots協議(也稱為爬蟲協議、機器人協議等)的全稱是「網路爬蟲排除標准」,網站通過Robots協議告訴搜索引擎哪些頁面可以抓取,哪些頁面不能抓取。該協議尊重信息提供者的意願,並維護其隱私權;保護其使用者的個人信息和隱私不被侵犯。Robots協議代表一種契約精神,互聯網企業只有遵守這一規則,才能保證網站及用戶的隱私數據不被侵犯。可以說,無論從保護網民隱私還是尊重版權內容的角度,遵守robots協議都應該是正規互聯網公司的默之舉,任何違反robots協議的行為都應該為此付出代價。
2、合理限制抓取的內容。在設置抓取策略時,應注意編碼禁止抓取視頻、音樂等可能構成作品的、明確的著作權作品數據,或者針對某些特定網站批量抓取其中的用戶生成內容;在使用、傳播抓取到的信息時,應審查所抓取的內容,如發現屬於用戶的個人信息、隱私或者他人的商業秘密的,應及時停止並刪除。對於內部系統數據,嚴格禁止侵入。
3、爬取行為不應妨礙網站的正常運行。企業應當合理控制爬取的頻率,盡可能避免過於頻繁地抓取數據,特別是如果超過了《數據安全管理辦法(徵求意見稿)》明確規定的「自動化訪問收集流量超過網站日均流量三分之一」的要求,就應當嚴格遵守網站的要求,及時停止數據抓取。
(二)爬取個人信息時恪守合法、正當、必要原則
在我國,合法、正當、必要原則散見於《消費者權益保護法》、《網路安全法》、《全國人大常委會關於加強網路信息保護的決定》、《個人信息安全規范》等法律與規范之中。網路經營者擬爬取用戶個人信息的,應當嚴格遵守上述法律法規的規定,以取得個人用戶的事前同意為原則,避免超出用戶的授權范圍爬取信息。同樣地,數據接受方也應當對以爬蟲方式獲取的他人信息進行合法性審查,了解個人信息主體是否同意共享個人信息數據。
(三)爬取商業數據時謹防構成不正當競爭
在數字內容領域,數據是內容產業的核心競爭資源,內容平台經過匯總分析處理後的數據往往具有極高的經濟價值,因此非法爬取行為在某些具體應用場景下會被認定為構成不正當競爭。尤其是對於雙方商業模式相同或近似、獲取對方的信息會對對方造成直接損害的,企業應重點予以防範。如果存在此種情形,則應當謹慎使用爬取獲取被爬取網站的數據。
四、結語
隨著大數據時代的來臨以及數字技術的蓬勃發展,數據的價值日益凸顯,部分企業通過數據爬取技術更加高效地獲取和深度地利用相關數據,從而彌補企業自身數據不足的現狀,支撐企業的商業化發展。對於這些企業而言,「網路爬蟲如何爬取信息數據才是合法的?」「爬取數據時如何做到合規?」是亟待解決的一大難題。作為法律工作者,應當從法律的專業角度給企業提供強有力的合規指引,為促進高新技術企業的發展,進而全面提升國家 科技 創新能力做出應有的貢獻。
❹ 大數據時代和科技時代,人工智慧時代三者一樣嗎,存在哪些異同
大數據的運用已經很廣泛很貼近生活了,人工智慧還差不少吧,目前面向的范圍還比較少,估計還得要有幾年,現在應該屬於半步入門,科技時代看怎麼定義了,感覺第一次工業革命就可以說屬於科技時代了吧!
❺ 為什麼MD5校驗是唯一的呢假設MD5的排列組合有N種,而現在是大數據時代,文件數量為N+M種
確實MD5越來越顯現出不足之處了,就拿我們常用的網路雲盤來說就時不時會遇到這種情況,下的明明是美劇上傳後發現被當作H片和諧了,究其原因就是網路雲盤用來區分不同文件的MD5碼相同了,兩個不同的文件被視為同一個文件。
所以現在像微軟公司發布補丁都改用SHA1安全哈希演算法,比MD5長度更長,出現編碼碰撞的可能性極大降低(理論上仍會有1x10 ^ 48分之一的機率出現相同的消息摘要)。
想想雲盤也只能採用這種手段來避免重復保存大量相同的視頻內容,但現代人喜歡拍照拍視頻的越來越多,不少人也愛上傳雲盤,這種數據量的增長才是可怕的。因為沒有復用性,10億人1人10000個個人文件總數就是10萬億,而1人10000個個人文件並不會有像想得那麼多,一次出遊拍幾百張照片,一二十趟就上萬張照片了,還不算各種自己做的工作文件。所以大數據時代MD5出現一定頻率的碰撞是遲早的事,現在很多協議已經轉向SHA1(160位),而256、384、512位的更高強度編碼也都在那了。
這里給希望上傳電影到雲盤卻發現被和諧了的朋友出個主意。找個ultraedit,打開視頻文件翻到最後一個位元組,或修改值,或在後面增加一個00位元組,保存文件,再上傳試試!這時候雖然視頻還是完全一樣但MD5碼已變,雲盤就會把它當成個新的文件單獨保存下來。這比把文件壓縮再上傳或者連同一個txt文件一起壓縮上傳可是方便多了,不光省了壓縮的時間,更重要的是還能直接雲播。