⑴ 百度網盤顯示包含違規內容的文件就再也打不開相當於丟失了是嗎
是的,網路網盤定期會進行掃描,一些敏感的和違規的文件會自動屏蔽或者丟失。珍貴的學習資料還是買個硬碟放,最好多買幾塊,互為主備,一個壞了,不影響另外一個。
建議自己的一些私人資源往自己的私人存儲里放,可以是自己的移動硬碟或者NAS,也可以自己搭建私人網盤來存儲,像我就是把一些私人資源放在私人網盤里,安全隱私,不用擔心發生這樣的情況。
網盤內容可能的審核方式:
1、關鍵字搜索:這是最簡單的審核方式,通過輸入關鍵詞,能將一些看起來明顯是違法、涉黃的內容直接幹掉。如果做好這一項,至少能將網盤分享的糟粕內容去掉一大半。
2、建立身份檔案:DNA是人類唯一的身份識別碼,而文件的DNA無疑是MD5,如果網盤能建立涉黃文件的MD5資料庫,用戶上傳後自動分析MD5是否合法,則能避免涉黃文件的重復分享。
3、自動截取視頻縮略圖:估計網路這樣的公司,應該能對色情圖片進行自動識別了。所以可以自動截取一個視頻的十來個地方的縮略圖,用色情圖片識別技術鑒別該視頻是否違法。
4、關注訪問量高的文件:訪問量高,基本是涉黃類分享內容的主要特徵之一,如果能在人工審核中,對這些訪問量突然躥升的文件進行審查,相比又會斃掉一部分文件分享。
⑵ 百度雲它是怎麼知道你上傳的文件有敏感內容的
在網上公開已久的電影,視頻,等一些文件網路雲一般都核查過並記錄到資料庫,如果你上傳的文件通過md5匹配到敏感內容的資料庫文件就會封禁,如果匹配不到也會在未來一段時間進行人工排查。(大體就是這么個原理)