如何利用網路技術從網站上下載數據_都在說爬蟲究竟什麼是爬蟲技術啊爬蟲技術能夠達到什麼效果

『壹』使用下載軟體在網路上下載電影這種網路應屬於什麼模式

文件伺服器模式。
系統模式是隨著網路技術和網路應用的發展而發展的，從文件伺服器模式到客戶機伺服器(C/S)模式，再到瀏覽器/伺服器(B/S)模式，經歷了一個較長的發展過程。
從資料庫伺服器的角度看,B/S模式是從C/S模式發展而來的,但有自己的許多特點，主要是Web與資料庫的連接方式不同於C/S模式,B/S模式的協議也不同，主要是基於TCP/IP網路的各層及協議的集合構成網路的體系結構,所以模式變化將引起網路體系結構的變化,也就是與OSI模型對應的網路層及協議將隨著模式的變化而變化。

『貳』誰能仔細解釋一下網路爬蟲

1 爬蟲技術研究綜述
引言�
隨著網路的迅速發展，萬維網成為大量信息的載體，如何有效地提取並利用這些信息成為一個巨大的挑戰。搜索引擎(Search Engine)，例如傳統的通用搜索引擎AltaVista，Yahoo!和Google等，作為一個輔助人們檢索信息的工具成為用戶訪問萬維網的入口和指南。但是，這些通用性搜索引擎也存在著一定的局限性，如：�

(1) 不同領域、不同背景的用戶往往具有不同的檢索目的和需求，通用搜索引擎所返回的結果包含大量用戶不關心的網頁。�
(2) 通用搜索引擎的目標是盡可能大的網路覆蓋率，有限的搜索引擎伺服器資源與無限的網路數據資源之間的矛盾將進一步加深。�
(3) 萬維網數據形式的豐富和網路技術的不斷發展，圖片、資料庫、音頻/視頻多媒體等不同數據大量出現，通用搜索引擎往往對這些信息含量密集且具有一定結構的數據無能為力，不能很好地發現和獲取。�
(4) 通用搜索引擎大多提供基於關鍵字的檢索，難以支持根據語義信息提出的查詢。�
為了解決上述問題，定向抓取相關網頁資源的聚焦爬蟲應運而生。聚焦爬蟲是一個自動下載網頁的程序，它根據既定的抓取目標，有選擇的訪問萬維網上的網頁與相關的鏈接，獲取所需要的信息。與通用爬蟲(general�purpose web crawler)不同，聚焦爬蟲並不追求大的覆蓋，而將目標定為抓取與某一特定主題內容相關的網頁，為面向主題的用戶查詢准備數據資源。�

1 聚焦爬蟲工作原理及關鍵技術概述�
網路爬蟲是一個自動提取網頁的程序，它為搜索引擎從萬維網上下載網頁，是搜索引擎的重要組成。傳統爬蟲從一個或若干初始網頁的URL開始，獲得初始網頁上的URL，在抓取網頁的過程中，不斷從當前頁面上抽取新的URL放入隊列,直到滿足系統的一定停止條件，如圖1(a)流程圖所示。聚焦爬蟲的工作流程較為復雜，需要根據一定的網頁分析演算法過濾與主題無關的鏈接，保留有用的鏈接並將其放入等待抓取的URL隊列。然後，它將根據一定的搜索策略從隊列中選擇下一步要抓取的網頁URL，並重復上述過程，直到達到系統的某一條件時停止，如圖1(b)所示。另外，所有被爬蟲抓取的網頁將會被系統存貯，進行一定的分析、過濾，並建立索引，以便之後的查詢和檢索；對於聚焦爬蟲來說，這一過程所得到的分析結果還可能對以後的抓取過程給出反饋和指導。�

相對於通用網路爬蟲，聚焦爬蟲還需要解決三個主要問題：�
(1) 對抓取目標的描述或定義；�
(2) 對網頁或數據的分析與過濾；�
(3) 對URL的搜索策略。�
抓取目標的描述和定義是決定網頁分析演算法與URL搜索策略如何制訂的基礎。而網頁分析演算法和候選URL排序演算法是決定搜索引擎所提供的服務形式和爬蟲網頁抓取行為的關鍵所在。這兩個部分的演算法又是緊密相關的。�

2 抓取目標描述�
現有聚焦爬蟲對抓取目標的描述可分為基於目標網頁特徵、基於目標數據模式和基於領域概念3種。�
基於目標網頁特徵的爬蟲所抓取、存儲並索引的對象一般為網站或網頁。根據種子樣本獲取方式可分為：�
（1）預先給定的初始抓取種子樣本；�
（2）預先給定的網頁分類目錄和與分類目錄對應的種子樣本，如Yahoo!分類結構等；�
（3）通過用戶行為確定的抓取目標樣例，分為：�
a) 用戶瀏覽過程中顯示標注的抓取樣本；�
b) 通過用戶日誌挖掘得到訪問模式及相關樣本。�
其中，網頁特徵可以是網頁的內容特徵，也可以是網頁的鏈接結構特徵，等等。�
現有的聚焦爬蟲對抓取目標的描述或定義可以分為基於目標網頁特徵，基於目標數據模式和基於領域概念三種。�
基於目標網頁特徵的爬蟲所抓取、存儲並索引的對象一般為網站或網頁。具體的方法根據種子樣本的獲取方式可以分為：（1）預先給定的初始抓取種子樣本；（2）預先給定的網頁分類目錄和與分類目錄對應的種子樣本，如Yahoo!分類結構等；（3）通過用戶行為確定的抓取目標樣例。其中，網頁特徵可以是網頁的內容特徵，也可以是網頁的鏈接結構特徵，等等。�

作者：齊保元 2006-1-10 10:11 回復此發言

--------------------------------------------------------------------------------

2 爬蟲技術研究綜述
基於目標數據模式的爬蟲針對的是網頁上的數據，所抓取的數據一般要符合一定的模式，或者可以轉化或映射為目標數據模式。�

另一種描述方式是建立目標領域的本體或詞典，用於從語義角度分析不同特徵在某一主題中的重要程度。�

3 網頁搜索策略�
網頁的抓取策略可以分為深度優先、廣度優先和最佳優先三種。深度優先在很多情況下會導致爬蟲的陷入(trapped)問題，目前常見的是廣度優先和最佳優先方法。�
3.1 廣度優先搜索策略�
廣度優先搜索策略是指在抓取過程中，在完成當前層次的搜索後，才進行下一層次的搜索。該演算法的設計和實現相對簡單。在目前為覆蓋盡可能多的網頁，一般使用廣度優先搜索方法。也有很多研究將廣度優先搜索策略應用於聚焦爬蟲中。其基本思想是認為與初始URL在一定鏈接距離內的網頁具有主題相關性的概率很大。另外一種方法是將廣度優先搜索與網頁過濾技術結合使用，先用廣度優先策略抓取網頁，再將其中無關的網頁過濾掉。這些方法的缺點在於，隨著抓取網頁的增多，大量的無關網頁將被下載並過濾，演算法的效率將變低。�

3.2 最佳優先搜索策略�
最佳優先搜索策略按照一定的網頁分析演算法，預測候選URL與目標網頁的相似度，或與主題的相關性，並選取評價最好的一個或幾個URL進行抓取。它只訪問經過網頁分析演算法預測為「有用」的網頁。存在的一個問題是，在爬蟲抓取路徑上的很多相關網頁可能被忽略，因為最佳優先策略是一種局部最優搜索演算法。因此需要將最佳優先結合具體的應用進行改進，以跳出局部最優點。將在第4節中結合網頁分析演算法作具體的討論。研究表明，這樣的閉環調整可以將無關網頁數量降低30%~90%。�

4 網頁分析演算法�

網頁分析演算法可以歸納為基於網路拓撲、基於網頁內容和基於用戶訪問行為三種類型。�
4.1 基於網路拓撲的分析演算法�
基於網頁之間的鏈接，通過已知的網頁或數據，來對與其有直接或間接鏈接關系的對象（可以是網頁或網站等）作出評價的演算法。又分為網頁粒度、網站粒度和網頁塊粒度這三種。�
4.1.1 網頁(Webpage)粒度的分析演算法�
PageRank和HITS演算法是最常見的鏈接分析演算法，兩者都是通過對網頁間鏈接度的遞歸和規范化計算，得到每個網頁的重要度評價。PageRank演算法雖然考慮了用戶訪問行為的隨機性和Sink網頁的存在，但忽略了絕大多數用戶訪問時帶有目的性，即網頁和鏈接與查詢主題的相關性。針對這個問題，HITS演算法提出了兩個關鍵的概念：權威型網頁（authority）和中心型網頁（hub）。�

基於鏈接的抓取的問題是相關頁面主題團之間的隧道現象，即很多在抓取路徑上偏離主題的網頁也指向目標網頁，局部評價策略中斷了在當前路徑上的抓取行為。文獻[21]提出了一種基於反向鏈接（BackLink）的分層式上下文模型（Context Model），用於描述指向目標網頁一定物理跳數半徑內的網頁拓撲圖的中心Layer0為目標網頁，將網頁依據指向目標網頁的物理跳數進行層次劃分，從外層網頁指向內層網頁的鏈接稱為反向鏈接。�

4.1.2 網站粒度的分析演算法�
網站粒度的資源發現和管理策略也比網頁粒度的更簡單有效。網站粒度的爬蟲抓取的關鍵之處在於站點的劃分和站點等級(SiteRank)的計算。SiteRank的計算方法與PageRank類似，但是需要對網站之間的鏈接作一定程度抽象，並在一定的模型下計算鏈接的權重。�
網站劃分情況分為按域名劃分和按IP地址劃分兩種。文獻[18]討論了在分布式情況下，通過對同一個域名下不同主機、伺服器的IP地址進行站點劃分，構造站點圖，利用類似PageRank的方法評價SiteRank。同時，根據不同文件在各個站點上的分布情況，構造文檔圖，結合SiteRank分布式計算得到DocRank。文獻[18]證明，利用分布式的SiteRank計算，不僅大大降低了單機站點的演算法代價，而且克服了單獨站點對整個網路覆蓋率有限的缺點。附帶的一個優點是，常見PageRank 造假難以對SiteRank進行欺騙。�
4.1.3 網頁塊粒度的分析演算法�
在一個頁面中，往往含有多個指向其他頁面的鏈接，這些鏈接中只有一部分是指向主題相關網頁的，或根據網頁的鏈接錨文本表明其具有較高重要性。但是，在PageRank和HITS演算法中，沒有對這些鏈接作區分，因此常常給網頁分析帶來廣告等雜訊鏈接的干擾。在網頁塊級別(Block�level)進行鏈接分析的演算法的基本思想是通過VIPS網頁分割演算法將網頁分為不同的網頁塊(page block)，然後對這些網頁塊建立page�to�block和block�to�page的鏈接矩陣，�分別記為Z和X。於是，在page�to�page圖上的網頁塊級別的PageRank為�W�p=X×Z；�在block�to�block圖上的BlockRank為�W�b=Z×X。�已經有人實現了塊級別的PageRank和HITS演算法，並通過實驗證明，效率和准確率都比傳統的對應演算法要好。�
4.2 基於網頁內容的網頁分析演算法�
基於網頁內容的分析演算法指的是利用網頁內容（文本、數據等資源）特徵進行的網頁評價。網頁的內容從原來的以超文本為主，發展到後來動態頁面（或稱為Hidden Web）數據為主，後者的數據量約為直接可見頁面數據（PIW，Publicly Indexable Web）的400~500倍。另一方面，多媒體數據、Web Service等各種網路資源形式也日益豐富。因此，基於網頁內容的分析演算法也從原來的較為單純的文本檢索方法，發展為涵蓋網頁數據抽取、機器學習、數據挖掘、語義理解等多種方法的綜合應用。本節根據網頁數據形式的不同，將基於網頁內容的分析演算法，歸納以下三類：第一種針對以文本和超鏈接為主的無結構或結構很簡單的網頁；第二種針對從結構化的數據源（如RDBMS）動態生成的頁面，其數據不能直接批量訪問；第三種針對的數據界於第一和第二類數據之間，具有較好的結構，顯示遵循一定模式或風格，且可以直接訪問。�

4.2.1 基於文本的網頁分析演算法�
1) 純文本分類與聚類演算法 �
很大程度上借用了文本檢索的技術。文本分析演算法可以快速有效的對網頁進行分類和聚類，但是由於忽略了網頁間和網頁內部的結構信息，很少單獨使用。�
2) 超文本分類和聚類演算法�
網頁文本還具有大量的

『叄』有誰可以教我怎麼從網站下載mv然後上傳到我的博客里去啊！！

下載教程】網上電影(流媒體)下載必殺技——絕屬精品

如果大家覺得好的話，一定要幫忙頂一下，這樣可以讓更多的會員看到！

現在大部分朋友都用上寬頻了，網上看電影也成了很多人新的生活方式。能不能將這些電影下載到本地硬碟中以便以後欣賞或收集整理、編輯呢？其實，網上豐富的電影資源主要都是一些流媒體文件，幾乎可以這樣說，凡是可以觀看的，都能夠把它下載下來。本專題就是要告訴大夥兒如何將網上的電影下載下來。
流媒體格式知多少
目前，在Internet上，傳輸音視頻信息主要有下載和流式傳輸兩種方案。受網路帶寬的限制，採用下載方式要花數分鍾甚至數小時，因而明顯有相當長的延遲，對於視頻點播、遠程教學等對實時性要求高的多媒體應用來說不合適；而流式傳輸採用的是邊接收邊播放的原則(即數據流由流媒體伺服器向用戶計算機連續、實時地傳送，客戶機不必等到整個文件全部下載完畢，只需經過幾秒或十數秒的緩沖即可觀看)，有效利用了帶寬，它不僅使啟動延時大大地縮短，而且不需太大的緩存容量。但是，流媒體文件雖然採用邊播放邊下載的方式進行，同時也「邊丟棄」，所以你別指望在流媒體播放完畢後能夠在硬碟的臨時文件夾中找到它們的蹤影(顯然，這是為節省客戶端存儲空間而考慮的)。
流媒體分為視頻、音頻兩類，這里主要討論視頻流，網際網路上主要有三家流媒體公司提供相應的流媒體格式。
1.Windows Media
Windows Media是由Microsoft公司推出的一種數據格式，音頻、視頻、圖像以及控制命令腳本等多媒體信息通過這種格式以網路數據包的形式傳輸，從而實現流式多媒體信息的發布。在網路上傳輸的內容就稱為「ASF Stream」。ASF支持任意的壓縮、解壓、編碼方式，可以使用任何一種底層網路傳輸協議，靈活性很大。常見的Windows Media有WMV/WMA/ASF/ASX等。WMV(Windows Media Video)用於表現視頻，WMA(Windows Media Audio)則是音頻文件，ASF( Advanced Streaming Format)則兩者都可以使用。ASX則是一種媒體播放列表文件。播放Windows Media流媒體文件的播放器首推微軟自己的Windows Media Player(媒體播放器)。這是一款能提供最強的擴展性、靈活性和方便性的多媒體播放軟體，可播放很多種類的多媒體格式文件。
2.Real Media
Real Media技術由Real Networks公司推出，在Internet上廣受歡迎。它作為較早的網際網路流式技術，已成為網路音、視頻播放事實上的標准。並且，為了支持一台視頻伺服器對多台伺服器的並發連接，Real Networks公司推出了一種復播技術，使它能夠在網路上以樹型結構復制伺服器，使網路響應不受影響。從Real System G2系統開始，使用了「Sure Stream」技術，對已安裝了Sure Stream的視頻伺服器，伺服器端會自動偵測該客戶端的Real Player的連接速度。根據客戶端不同的撥號速率和帶寬，讓音頻和視頻數據流根據相應的帶寬傳輸不同壓縮比率的圖像，使其始終以流暢的方式播放。Real Media的文件格式通常有.RM/.RA/.RAM，RM一般為視頻文件格式，RA為音頻文件格式，RAM則是媒體播放列表文件。
3.QuickTime
QuickTime是Apple公司推出的一種流媒體格式，它面向專業視頻編輯、Web網站創建和CD-ROM內容製作開發，是數字媒體領域事實上的工業標准。它可以通過Internet提供實時的數字化信息流、工作流與文件回放功能。QuickTime流媒體文件格式為「QuickTime電影(Movie)文件格式」，其擴展名為.MOV。QuickTime技術具有目前最高音頻和視頻播放質量的播放器，內置Web瀏覽器插件(Plug-in)技術；支持RTP、RTSP、SDP、FTP和HTTP等多種網路協議；支持多種視頻和動畫格式。
提示：下載MOV文件的簡易方法
MOV的流媒體文件在國內網站上很少看到，但在外國網站上很多，尤其是一些著名歌星的個人官方網站。MOV流媒體文件下載比較有效的方法是在線看完後通過Windows查找*.mov文件，往往就在C盤的Temporary Internet Files文件夾中。
下載HTTP/FTP 協議的電影
對於使用HTTP、FTP協議傳播的電影，請不要使用IE直接下載或使用滑鼠右鍵菜單中的「另存為」來保存，推薦使用網際快車(FlashGet)這類下載工具。使用網際快車下載此類協議的電影也要注意正確設置：先單擊「工具」菜單下的「選項」，然後在「連接」選項下的「限制」中選中「不限制重試次數」，然後在同一對話框的「協議」選項卡下，把「HTTP」下的「用戶代理」改為「Internet Explore 5.x」。這是因為多數伺服器會限制下載的總人數，超過這一限制便會報錯。
對於使用HTTP協議的WMV/RM等格式流媒體文件都可以按上述方法進行下載。如果頁面中的鏈接是一個RAM文件，則將它下載到本地硬碟後用記事本打開，可以見到類似「RTSP://61.157.237.18/18e/lxj/kangxidadi/**.rm」等字樣的鏈接。將此鏈接復制到後文將要提到的StreamBox VCR或影音傳送帶中就可以實現下載。
當然這樣設置後也未必能夠絕對下載，有可能是伺服器在該段時間內連接不上，此時你應考慮換個時間再試試(比如凌晨下載人數通常最少)。
對於使用FTP 協議的電影連接也推薦用「Flash Get(Jet Car)」進行下載，如果知道FTP站點地址、登錄用戶名和密碼等，可以仿照這樣的格式在瀏覽器地址欄中輸入「FTP://用戶名：密碼@FTP伺服器的IP地址」。登錄後在文件夾上單擊右鍵，選擇「復制到文件夾」，選擇一個本地文件夾，也可以實現下載，不過效果不是太好。如何用網際快車來下載就要注意了。和HTTP協議相比較，FTP可以對每個IP的線程數進行控制，所以沒必要多開，因為多開的線程也無法達到下載文件的目的。有些網站上說要「單線程」下載，就是指的這個。由於FlashGet本身是一個多線程下載工具，所以請先調整為單線程。方法是：把下載鏈接添加到下載任務時，會出現一個屬性對話框，將「常規」下「文件分成」後的數字改為「1」，在下載時就會看到只有一個「jet1」在工作，這就是單線程下載了。
此外，很多FTP下載需要密碼，則需要在將它添加到下載任務時出現的屬性窗口加入：在「屬性」窗口的「常規」選項下，勾選「登錄到伺服器」，然後在下面填寫登錄到該FTP伺服器所需要的用戶名和密碼。
對於通過FTP方式提供下載的鏈接，可以使用專門的FTP文件傳送、下載工具來下載。這方面的工具很多，方法大同小異，在此簡單介紹一下使用國產的FTP工具《流星雨貓眼XFTP》來下載「210.192.96.39」站點上文件的步驟：
① 首先在XFTP軟體的「工作視圖」中，「FTP伺服器」文件夾下點擊右鍵，選擇「快速添加新站點」，在「FTP地址」後寫入「210.192.96.39」，然後輸入用戶名和密碼，其餘項目取默認值，確定。
② 左鍵單擊此新增站點名稱，這樣便會自動開始連接，如果連接順利，你會在「連接信息」下見到「"/" is current directory」、「/目錄下的文件查找結束」等信息，同時可以在該站點名稱下展開文件夾。
③ 選中需要的文件，將它拖動到本地磁碟上。
④ 點擊「計劃隊列」項目，在要下載的文件上點右鍵，選擇「傳送」，接下來就慢慢等待XFTP將它下載下來吧。
此外，對於MPEG/AVI等電影格式雖然不是流媒體，但在網上也特別豐富(尤其是在FTP站點上)，這些文件通常使用HTTP或者FTP協議，所以這里的方法對它們也有效。
常見流媒體協議
不同的流媒體文件在播放時會用到不同的協議，為了讓下載做到有的放矢，很有必要先看看各種流媒體所使用的協議。
1.與其他文件通用的兩種協議
實際上流媒體文件本身也是一種文件，所以對於其他文件所使用的協議也是支持的。這兩種協議就是HTTP和FTP。
1)HTTP協議
「HTTP協議」就是目前網頁上廣泛使用的「超文本傳輸協議」(Hyper Text Transfer Protocol)，在某些流媒體傳輸時也採用該協議。如「http://www.pinghu.net/try/02.asf」這樣一個地址中盡管也採用了http協議，但它同樣可以直接在Windows media player中播放，又如在瀏覽器的地址欄中輸入「http://61.157.237.18/18f/kh/yzw_101.ram」則首先會將指定的RAM文件下載，然後調用系統中安裝的RealOne player來播放該文件中所引用的RM/RA文件。
2)FTP協議
「FTP協議」的全稱是「文件傳輸協議」(File Transfer Protocol)，主要用於在網際網路上負責傳送文件。有些電影是放在FTP伺服器上的，通過該協議可以獲取它們(需要使用相應的支持FTP協議的下載工具)。
2.最常見的兩類流媒體協議
1)MMS協議
MMS的全稱是「Microsoft Media Server」(微軟媒體伺服器)，這種協議由微軟制定，用來訪問並且用於流式接收Windows media伺服器中的流文件，也是連接Windows Media單播服務的默認方法。當在Windows Media Player中輸入一個URL以便連接播放內容時要使用這個協議，當用 MMS 協議連接到發布點後，伺服器會使用「協議翻轉」來獲得最佳的連接。例如「mms://windows_media_server/sample.asf」這樣一個地址中，「windows_media_server」為 Windows Media的伺服器名，「SAMPLE.ASF 」是想要使之轉化為流的.ASF文件名。在網上播放ASF/WMV文件時，常用這種協議，相應的還有MMST協議。
提示：在數碼領域也有個「MMS」，這個「MMS」是多媒體信息服務(Multimedia Messaging Service)的英文縮寫，是WAP論壇和3GPP(3rd Generation Partnership Program)制定的移動環境下新的信息服務標准，人們俗稱的「彩信」就是它。大家不要搞混淆了。
2)RTSP協議
RTSP(Real Time Streaming Protocol)是由RealNetworks和Netscape共同提出的，是一種實時流協議。該協議定義了一對多應用程序如何有效地通過IP網路傳送多媒體數據。RTSP在體系結構上位於RTP和RTCP之上，它使用TCP或RTP完成數據傳輸。與HTTP相比，HTTP傳送HTML，而RTSP傳送的是多媒體數據，HTTP請求由客戶機發出，伺服器做出響應。使用RTSP時，客戶機和伺服器都可以發出請求，即RTSP可以是雙向的。現在很多公司都宣稱它們的在線播放器支持RTSP協議(不過微軟一直都堅持不支持此協議)。最典型的應用就是用來播放RealMedia文件。
下載MMS協議的電影
微軟的WMV電影格式多用MMS協議來播放，這些電影是不能使用《網路螞蟻》等來下載的(因為這些工具不支持MMS協議)。不過你也不用擔心，目前能夠下載MMS協議流媒體的工具軟體還真是不少。下面我們通過一些例子來看看各個工具的主要用法。
1.HiDownload
HiDownload是一款可以從Web、 FTP站點和MMS站點下載文件的下載管理工具。它允許你以最快的速度下載電影、音樂和MP3等文件。在這里，我們只探討怎樣用它來下載使用MMS協議播放的電影。
例如，進入央視網站的「視聽在線」頁面(http://www.cctv.com/tvonline/media.html)，在頁面的下面有羊年春節晚會上的部分節目可供欣賞。我們想要下載其中的相聲《馬路情歌》，則按下面的步驟進行：
①右鍵單擊該節目右邊的媒體播放機圖標，從快捷菜單中選擇「復制快捷方式」，打開記事本，該快捷方式粘貼進去，發現該快捷方式對應的目標其實就是「javascript:playsrc("MMS://winmedia.cctv.com.cn/specials/2003spring/56k/241894.wmv")」，顯然，其中的「MMS://winmedia.cctv.com.cn/specials/2003spring/56k/241894.wmv」便是該節目的真實地址。
②選中並且復制該地址。
③啟動HiDownload，點擊工具欄上的「增加」按鈕，在「增加任務」窗口中將上述地址粘貼到「URL」文本框中，確定返回主界面，即可開始下載。
2.Hi-Net Recorder/Player
HiDownload、《網路鼴鼠》之類的工具雖然可以實現對使用MMS協議的流媒體電影進行下載，但是必須等到下載完畢才能知道所下載文件的內容。如果你希望可以邊看邊下載，不妨試試「Hi-Net Recorder/Player」。
來自韓國的Hi-Net Recorder/Player 具有播放及錄制流媒體功能，可以讓你在下載的同時觀看所下載的電影的內容，它只支持下載WMV和ASF文件。在Hi-Net Recorder/Player的主界面上的工具按鈕既有用來播放文件的(Player)，也有用於錄制(Rrecorder)的。步驟如下：
①在主界面上單擊滑鼠右鍵，從快捷菜單中選擇「URL open」項，然後在對話框中輸入要下載的流媒體電影的URL鏈接，單擊「Play」(播放)返回主界面。
②如鏈接有效，稍等片刻便會自動開始播放，同時可見到主窗口中「Recorder」(錄制)下的圓形按鈕變紅。
③單擊該紅色按鈕可以錄制，默認將錄制的文件保存在c:\temp下。如要修改此路徑，則在右鍵快捷菜單中單擊「Preferences」(參數選擇)，然後在打開的對話框中的「Default Path」(默認路徑)下修改；接下來便可以觀看並等待Hi-Net Recorder/Player將它下載到硬碟中。
3.Stream Download Project
「Stream Download Project」簡稱「SDP」，也是一個可以邊觀看邊下載MMS協議流媒體文件的工具。SDP可以讓你突破諸多限制，順利將ASF、ASX、WMV等格式的影片下載回來。
這個軟體的界面與《網路螞蟻》、《網際快車》的風格很不同，沒有那樣的窗口結構和拖放籃，不過使用上一點也不困難。
① 確認要下載的WMV等文件的觀看地址並且復制。
② 在SDP中單擊「Open」(打開)按鈕，在彈出的窗口中把地址粘貼進去，單擊「OK」返回主窗口。
③ 接下來單擊「Go」(執行)按鈕，窗口中會出現相應的連接信息文字，並在文字說明上方出現一個紅色進度條從左到右滾動。當該進度條到最右邊時，文件便「躺」在了你的硬碟中，並且會默認自動啟動播放器播放剛剛下載的文件。
④ 如果不想下載完畢才啟動放映，而是需要在下載的同時觀看文件的內容，則可以單擊工具欄上的「Preview」(預覽)按鈕調出預覽窗口，通過其上的控制按鈕對播放進行控制。
下載RTSP協議的電影
RTSP協議用於播放RM格式的流媒體文件，當我們點擊一個使用RTSP協議開頭的流媒體鏈接時，系統會自動調用Real Player 或Real One Layer(系統中應安裝有該播放器)來播放。相對於MMS協議的電影來講，能夠支持RTSP協議電影下載的工具不是特別多，但你應該相信它們個個都是精品。或許你有時使用這些工具並不能下載到任何RM電影，但這不是軟體的錯。還是那句話，只要能夠播放便可以下載。
下面介紹兩種RTSP協議流媒體的下載工具的用法。
1.Net Transport(影音傳送帶)
「影音傳送帶」是目前國內少有的可對MMS(可以多線程)、RTSP(PNA)協議文件進行下載的工具之一。它的優點多多，如下載速度一流，CPU佔用率低(尤其在寬頻上特別明顯)等等。目前支持 HTTP、FTP、MMS和 RTSP等協議，而且除了RTSP之外的其餘協議均可以實現多線程斷點續傳(只要站點支持)。雖然筆者通常用它來下載RTSP協議的電影。這里仍要提一下該軟體對MMS協議的多線程續傳功能：因為MMS流每秒的位元組數差不多是固定的，這就決定了MMS流本身不能充分利用用戶所有的帶寬，所以多線程技術在縮短MMS流下載時間方面的效果是立竿見影的。遺憾的是目前的下載軟體中，很少有支持MMS多線程下載技術的，而Net Transport正好彌補了這個空白。
如同前面所提到的多數工具一樣，軟體也會出現一個方便添加任務的「拖放籃」(估計這都是向「螞蟻」學習而來的，呵呵)。要下載電影，可以把要下載的電影鏈接作為任務通過該拖放籃來添加，當然也可以不使用拖放籃而是使用工具按鈕來操作。
啟動「影音傳送帶」後，單擊工具欄上的「新建」按鈕，可以彈出「添加新的下載任務」對話框。按照前述方法將地址粘貼到URL後確定，之後開始下載。由於本身是中文軟體，所以所有的提示信息一目瞭然。相信有了前面軟體的使用作為基礎，添加、刪除等操作不會難倒各位了。
影音傳送帶的幾個小技巧：
（1）雖然Net Transport不直接支持PNM協議，但在下載PNM協議文件的時候可以將PNM改成「rtsp://site:7070/...」試試，其中7070是PNM的默認埠號。
（2）如果某RTSP文件不能下載，可以將RTSP改為HTTP，注意去掉RTSP的默認埠號554，將它當作普通文件直接下載。
（3）如果Net Transport不能下載某些HTTP協議文件，這是因為某些站點需要Cookie，而Net Transport默認情況下Cookie是關閉的，打開方法是：依次單擊「工具→選項→下載→Cookie→確定」。
（4）下載時不必指定文件存放的類別，下載完成後可以使用拖曳功能移動指定的任務到相應的類別中去。
（5）若要忽略Net Transport的瀏覽器捕捉，可以右鍵單擊懸浮窗口，然後單擊「監視瀏覽器」，取消前面的小鉤。
（6）影音傳送帶下載RTSP協議的電影，只能開單線程。
（7）流媒體文件經MMS協議下載後是沒有索引的，因為下載過程中文件大小是毛估估的不十分精確，也就沒有辦法添加索引於末尾，此時使用WMP(Windows Media Player)7版本以上只能順序觀看。通過使用任務欄中「製作ASF流索引」功能，不但可以隨意拖動播放，而且會修復損壞的部分以及刪除時間重復的部分以使影音更流暢。
2.StreamBox VCR
StreamBox VCR是一個名氣較大的流媒體下載工具(我個人認為此軟體下載RTSP協議文件的能力遠不如影音傳送帶)，熟悉它的朋友很多。StreamBox VCR 不但支持點播形式的流節目，也支持現場流節目，而且兩者可以同時下載。由於採用了獨特的分析技術，所以可以把那些隱藏在ASX後的ASF文件和隱藏在SMIL文件後的RM文件找出來並進行下載，這個功能是挺實用的。StreamBox VCR 支持的流播放協議相當齊全，Http、FTP、RTSP、MMS、PNM 等協議它全部都支持，並可以在下載的時候自動判別。除此之外，支持斷線續傳、拖放下載等作為下載軟體必要的功能它也有，且不同版本的StreamBox VCR可以分別用來下載軟體、ASF/WMA和RM/RA格式的流媒體文件。如果要來下載軟體，建議用1.0 Beta 2版本；如果要下載MMS協議的流媒體，則使用1.0 beta3版本；而下載RTSP協議的電影，則使用1.0 BETA 3.1為佳。三者用法大同小異。
下面用下載「RTSP://211.18.09.188/*.rm」(RTSP協議)的流媒體來說明方法。
①復制該鏈接「RTSP://211.18.09.188/*.rm」。
② 啟動StreamBox VCR 1.0 beta 3.1，在其主窗口中點右鍵(第一次運行軟體時，會要求輸入密碼和郵件地址等信息)，選擇「粘貼」菜單項，立即出現「新建項目」窗口，在「下載地址」欄中已經自動填寫好了剛才復制的地址(軟體可以自動探測剪貼板中的內容)，選擇一個「保存位置」。如果不熟悉下載協議就選擇「自動」讓它自動配置。
③ 單擊「好」，返回主窗口，可以見到該文件正在被下載。
提示：某些流媒體節目可能是用的pnm://協議播放，如果直接在瀏覽器地址欄輸入這個地址，則會調用Real One Player來播放，要下載這個流媒體節目，請在StreamBox VCR中進行，並且將協議選擇為「PNM(HTTP)協議」。
如果你覺得復制粘貼太麻煩，那麼就用拖放吧！盡管StreamBox VCR沒有NetAnts和網際快車那樣的浮動拖放窗口，但它仍然支持滑鼠拖放。當在網上找到一個需要下載的數據流文件時，只要直接按住滑鼠左鍵把這個地址鏈接拖放到StreamBox VCR的主窗口中就可以進行下載。
為了得到理想的下載效果，對StreamBox VCR作一些設置會更有利於今後的使用：在Streambox VCR中，點擊「查看/程序設置」，在「Main」(主要)選項中將「最大的下載數」的值設定為10以上，如果你的網路帶寬相當大，機器性能強悍，該數值還是大一些為好。進入「Time」(時間設置)選項，將「超時」的值設定大一點，最少要為60，該值較大則允許StreamBox VCR連接伺服器的時間也會延長，因為有的伺服器反應時間比較慢。如用預設的40秒或者改得更小，常會在連接中一直出現錯誤提示，使人產生一種錯覺(比如下載地址錯誤、文件不存在，等等)。特別是隨著寬頻的逐漸普及，在線看電影的朋友越來越多，能夠連接上伺服器的時間當然會更長一些，所以這個值還是大點為好。
「Time」項下的「重試空閑」的值改為2秒，這樣可以使StreamBox VCR在每次遇到連接錯誤後，與下次重試的間隔短一些。此外，同樣是在「Time」選項下，將「不停地重試直至失敗」復選框選中，意思是讓軟體除非是在下載中因不可預知的原因而停止，否則就要進行無限次的連接。然後進入「Connection」(連接)選項，將「帶寬」改為「T1 LAN」，不管你的帶寬真正是多少，都可以將它設定為T1，從而騙過伺服器，使之相信你正用高速寬頻與它進行連接，原因是有些伺服器會檢查你的帶寬設置。如果你設置為「56K Modem」或「56K ISDN」這樣的低速度，有些伺服器就會拒絕連接，從而導致無法正確下載電影。改為「T1 LAN」還可以避免有些電影才下載一部分便報告下載完成。
設置完畢後，單擊右方的「OK」按鈕，將設定保存為系統的默認值，這樣就不必每次下載之前都來設置了。
用了這么多工具，大家不難看出下載流媒體的主要過程如下：
①先在瀏覽器中找到要下載的流媒體節目，在其鏈接上面點滑鼠右鍵，選擇「復制快捷方式」，把鏈接地址復制進系統剪貼板中。
②運行流的下載工具，通過軟體提供的添加任務功能添加任務。這些軟體幾乎都有自動監視剪貼板的功能，所以在URL欄中都會自動把剛才的地址粘貼上去，做一些簡單配置(比如選擇文件的保存路徑和文件名等)。
③返回主窗口，等著軟體默默地將電影下載下來吧。
***介紹完這么多下載軟體，最後推薦大家使用影音傳送帶(Net Transport)和網際快車(FlashGet)，這兩種幾乎是全能的下載軟體（上面已介紹過了），從實際使用過程中，我個人感覺網際快車的下載穩定性要好於影音傳送帶。***
挖出隱藏的流媒體文件
前面所說的方法都是針對可以直接找出流媒體文件地址而言的。上述工具的出現，使朋友們不僅可以像以前那樣在線觀看電影，也能夠將自己喜愛的電影下載下來。可是在很多時候，我們打開一個頁面後，並沒有發現頁面中有流媒體文件的地址，但在網頁上卻有一個內嵌的媒體播放器，而且也能夠播放。能播放就說明流媒體文件肯定存在，只是在網頁上被隱藏起來了。怎樣才能找出隱藏的流媒體文件呢？
1.查看快捷方式所指向的地址
隱藏得比較簡單一點的就是不能直接看到文件的真實鏈接地址。比如前面提到的央視網站上的節目都用「javascript:playsrc( )」來指明其地址。像這樣的隱藏地址，只須在相應的節目圖標上單擊右鍵，選擇「復制快捷方式」，然後在記事本中粘貼，將括弧中的內容去掉引號就可以得到文件真實地址。
提示：不要總是試圖通過在右鍵菜單中選擇「屬性」來查看文件的真實地址，比如央視網站上那些節目圖標。如果查看其屬性，你會發現它們其實只是一些GIF圖片文件——因為你查看的是「圖標」的屬性，而不是該圖標到底鏈接到了何方。
2.分析網頁文件的源代碼找出關鍵字
有些網站上的節目，用第一種方法會無功而返。盡管看起來網頁的播放界面和央視網站比較類似(都會出現一個播放控制窗口)，但原理大不相同。不過，只要能夠播放，文件肯定在。若網頁的播放器界面為RealOne Player，說明這可能是一個RM格式的文件(也有可能是RAM文件)，根據前面所介紹的協議和文件名對應關系可推測，這個文件應該是採用RTSP協議播放的，且可能是一個用RM作為擴展名的文件。在該頁面上點擊右鍵，選擇「查看源文件」，系統會用相關聯的編輯器打開，在源文件中使用搜索功能查找關鍵字「rm」，可查到類似「RTSP://*.*.*/*.rm」這樣一些文字，這正是要找的文件地址。剩下的操作就是復制它，然後再啟動影音傳送帶或StreamBox VCR下載即可。但有時候有的網站會把影片作為一個窗口單獨彈出，如果我們用IE打開的話它的IE地址和菜單欄就看不到了。據說騰訊的瀏覽器可以將它破解，其實不用那麼費勁，我們只需要在IE的歷史中找到這一頁，仍然可以用前述的方法找到其地址。
提示：上面提到「不要總是試圖通過在右鍵菜單中選擇『屬性』來查看文件的真實地址」，也不能太絕對。比如有這樣一個網頁「http://www1.surfingfun.net/works/play.aspx?no=397214」，進入後便會聽到歌聲(確實存在一個流媒體文件)，可是你查看源文件，輸入歌曲常見格式的幾種擴展名去搜索都不會指明文件的絕對地址。當輸入「ASF」查找時會看到「playvoice("2002-10-18-22-13-20-9060000.asf")」字樣的文字，但還是不能知道准確地址，甚至你使用下面要提到的嗅探器也找不出有用的東西。但是，當把滑鼠移到網頁的底部，會發現有一個播放控制圖標。右擊它查看屬性，在這里詳細指出了文件的真實位置。因此，多種方法一定要靈活使用。
3.斷線法
此法只適用於通過網卡上網的用戶，而且只對RM格式片子有用。具體操作如下：進入電影播放頁面以後先暫停，在Win98的開始運行菜單裡面輸入Winipcfg然後回車，這時會彈出一個「IP配置」對話框，然後按播放鍵開始播放影片，等到播放的的緩沖進度剛剛出來的時候就按「IP配置」對話框中的「全部釋放」按鈕，這樣就會產生斷線，Realplay播放器就會報錯，錯誤信息裡面就包含了電影的真實地址。需要說明的是Realplay 9.0和它的升級版Realone都修復了這個漏洞，所以我建議大家還是裝一個8.0的版本，再安裝一個編碼升級包，這樣用RealVideo9.0編碼標准壓縮出來的RM文件也照樣能看。
4.用嗅探工具嗅探
對於一些隱藏更深、保護更完善的流媒體文件使用上述方法都不能奏效——既看不到快捷方式，也不能查看源文件(例如屏蔽了IE的右鍵菜單)，此時怎麼辦呢？別著急！不能下載的

『肆』 readminlan原理

Readminlan原理是一種分布式網路技術，它可以將多個計算機連接在一起，形成一個區域網。它使用了一種特殊的協議，叫做「Readminlan」，來實現這一目標。

Readminlan協議使用了一個中心伺服器來作為數據傳輸的中心，其他的節點都會連接到這個中心伺服器上。當一台節點想要發送數據時，它會將數據發送到中心伺服器上，然後再由中心伺服器將數據發送到其他的節點上。

Readminlan協議也使用了一些特定的加密方法來保證數據傳輸的安全性。這樣就能夠保證在傳輸過程中不會出現任何泄露或者遭到黑客入侵的情況。

『伍』網站運營數據分析通過什麼途徑

網站運營數據分析通過什麼途徑？

中企動力信息化運營專家認為，需要分析的數據一般包括：哪些改變能吸引更多的網站瀏覽量（比如點擊網路廣告進入）；哪些網頁的點擊量最大；網站訪問者進入網站的來源；通過什麼關鍵詞進入的；網站訪問者在各種網頁上逗留的時間有多長，等等。當然，最關鍵的指標是銷售轉換率（意向客戶轉化率）有多高，網站的注冊人數有多少，每個客戶的成本是多少等等。此外，企業還希望了解新的措施（如，定製新的當日遞送的價格，為提高銷售量在網站上開展促銷活動等）是否有效。網站運營數據分析所需要的數據可以通過多種途徑獲得：企業網站的伺服器日誌記錄了用戶的IP地址，用戶使用的是什麼瀏覽器，進入網站以前他所在的位置，瀏覽的具體時間，以及用戶的注冊信息等。通過IP地址，企業可以了解用戶所在區域，例如jp表示用戶住在日本。網路跟蹤文件是用戶在訪問網站時在硬碟上自動生成的文件。當客戶進入網站並進行操作（例如使用購物車）時這些文件能發揮作用。客戶再次訪問該網站時，這些文件中的數據可以調出，從而了解該客戶瀏覽的次數等信息。亞馬遜網站就是利用網路跟蹤器文件在主頁上自動生成用戶姓名的。頁面標簽（page tags）其實就是頁面上的一個像元（pixel），用戶是看不見的。在用戶瀏覽一個頁面時，頁面標簽被用來激活頁面上的一個信息，例如何時將商品從購物車移出等。用戶計算機硬碟上的網路跟蹤器文件也可以用來激活標簽，顯示用戶何時回訪網站，在網站上做了哪些動作。
利用網站解析軟體，企業可以對伺服器的登錄信息進行分析，進而解析用戶的行為模式。
中企動力信息化運營專家提醒：目前，谷歌的Analytics和網路統計都是智能的、功能非常強大的用來統計企業網站運營數據的專業工具，用戶非常多，備受推崇。

B2C網站運營每周數據分析那些指標

用戶下單和付款不一定會在同一天完成，但一周的數據相對是精準的，所以我們把每周數據作為比對的參考對象，主要的用途在於，比對上周與上上周數據間的差別，運營做了某方面的工作，產品做出了某種調整，相對應的數據也會有一定的變化，如果沒有提高，說明方法有問題或者本身的問題並在與此。
1. 網站使用率：IP、PV、平均瀏覽頁數、在線時間、跳出率、回訪者比率、訪問深度比率、訪問時間比率。
這是最基本的，每項數據提高都不容易，這意味著要不斷改進每一個發現問題的細節，不斷去完善購物體驗。來說明下重要的數據指標：
1.1 跳出率：跳出率高絕不是好事，但跳出的問題在哪裡才是關鍵。我的經驗，在一些推廣活動或投放大媒體廣告時，跳出率都會很高，跳出率高可能意味著人群不精準，或者廣告訴求與訪問內容有巨大的差別，或者本身的訪問頁面有問題。常規性的跳出率我注於登錄、注冊、訂單流程1-3步、用戶中心等基礎頁面，如果跳出率高於20%，我覺得就有不少的問題，也根據跳出率來改進購物流程和用戶體驗。
1.2 回訪者比率=一周內2次回訪者/總來訪者，意味著網站吸引力，以及會員忠誠度，如果在流量穩定的情況下，此數據相對高一些會比較高，太高則說明新用戶開發的太少，太低則說明用戶的忠誠度太差，復購率也不會高。
1.3 訪問深度比率=訪問超過11頁的用戶／總的訪問數，訪問時間比率=訪問時間在10分鍾以上的用戶數／總用戶數，這兩項指標代表網站內容吸引力，數據比率越高越好。
2. 運營數據：總訂單、有效訂單、訂單有效率、總銷售額、客單價、毛利潤、毛利率、下單轉化率、付款轉化率、退貨率；
每日數據匯總，每周的數據一定是穩定的，主要比對於上上周的數據，重點指導運營內部的工作，如產品引導、定價策略、促銷策略、包郵策略等。
2.1 比對數據，為什麼訂單數減少了？但銷售額增加了？這是否是好事？
2.2 對比數據，為什麼客單價提高了？但利潤率降低了？這是否是好事？
2.3 對比數據，能否做到：銷售額增長，利潤率提高，訂單數增加？這不是不可能。
所有的問題，在運營數據中都能夠找到答案。

如何快速入門網站數據分析與運營

一、如何入門互聯網數據分析
1、網站分析是一種能力
對於大部分人互聯網從業者而言，網站分析是一種能力，因為基於網站分析之上的結論可以指導運營、產品、設計、技術的同事的工作。
2、網站分析解決的問題
用戶是誰(目標用戶)，
從哪裡來(流量從哪裡來，流量的價值等)，
到哪裡去(為什麼離開，如何降低用戶流失)
3、對於產品OR運營，網站分析能做什麼
產品改版是否合理?
用戶的反饋如何?
哪些功能存在問題?
功能使用頻率?
轉化路徑是否靠譜?
對於運營：
用戶來源路徑?
用戶活躍度如何?
如何分配廣告預算
網站內容是否有效?
如何分解KPI?
4、為什麼進行網站分析
5、網站分析的核心
二、網站分析的流程
定義問題——測量——分析——改進——維持
三、定義問題
如何你已經知道如何有效的去描述一個問題，那麼你已經成功了一半了，因為你知道問題，而且也知道如何去問。
工作可不是試券設計好問題來問你，首先得你自己發現問題。
比如如注冊轉化率的降低就跟非常多的問題是正相關的。
產品支持度是否足夠?
頭像上傳
郵箱驗證
必填資料
營銷是否到位?
新老訪客比如何
外界口碑如何
問題的要素：本質、現象、特徵、量化
定義一個問題：即給整個團隊確認一個方向，圍繞著這個目標往下分解，制定計劃，在計劃具體執行的過程中發現了某個問題，再來具體分析的。
所以作為一個網站分析師，立足點應該是從公司戰略出發，了解產品，運營，技術，商業邏輯等等層面的知識，給公司的發展提供大量的建議。
獻峰商業&產品&運營&設計，的推薦書單：
豆瓣豆列的推薦人數達 1316人，收藏人數達 6291。目前我讀看過的不到十分之一，但是確實有助於從事網站分析的同事提升商業格局。
互聯網產品經理全方位入門
蘇傑老師整理的互聯網產品經理全方位入門書籍。豆瓣豆列的推薦人數達986人，收藏人數達 7774。慚愧，只看過豆列裡面20%的書。
當當，僅僅通過讀書是無法培養行業格局的，還需要善於向人請教、善用網路資源、自己體驗、實踐等等。
求職互聯網數據分析，如何准備行業知識?
四、測量
收集數據。
目前常用的數據流量監測的工作：
Google AnalyticsGoogle 網站分析工具
Omniture Omniture SiteCatalys
網路統計網路統計工具騰訊分析主要針對論壇
等等。。。。
比如教育行業的數據，可以從一些行業數據收集的網站中找到
另外，作為不會寫程序的產品OR運營，只能通過第三方的工具或者平台來拿到數據了，或者向技術同學提需求。
技術才是第一生產力。如果會一些 SQL或者Python，獲取的數據太要太精彩哇……
推薦書籍：做數據分析不得不看的書有哪些?
這個問答下面推薦的書，基本都是關於數據挖掘或者獲取的。
五、分析、改進、維持
比如某游戲的玩家行業軌跡是這樣的
於是分析的時候決定重點關注新用戶的流失問題
流失的任務類型分析：
操作復雜
任務不平滑、不流暢
升級緩慢
有組隊任務或者其他互動任務
然後就是不斷的循環優化著。分析出問題，確認用戶的需求，改進產品，進一步統計並維持提升結果。
分析的流程方法大概如此，比較好掌握，但是具體到工作當中，遠非這幾句話能解釋當的，所以慢慢實踐成長吧。
1.精益數據分析
2.轉化:提升網站流量和轉化率的技巧
3.數據分析 :企業的賢內助
4.網站數據分析:數據驅動的網站管理.優化和運營
5.人人都是網站分析師:從分析師的視角理解網站和解讀數據
6.圖解網站分析36大數據

通過網站數據分析,對網路營銷起到什麼作用?

網站數據是直接體現出網路營銷的效果的數據。
網路營銷的效果是需要網站數據體現出來的。
如果沒有網站的數據統計很難對網路營銷的成果作出量化，沒有量化的數據統計，就不能對網路營銷的效果有一個整體的分析，只有有了一個系統的分析才會有一個良好的網路營銷效果。
康那裡士數字營銷，長期從事網路營銷策劃與推廣工作。

網站運營怎麼能缺少數據統計怎樣的數據分析最有效

簡單的統計代碼還是跟蹤流量來源……或者根據網站運營目的，達到某一特定需求進行有效分析。早期的網站建設和運營，在數據很少的時候，網站更注重流量和渠道，而網站運營相對成熟的時候，數據分析更應該偏向於網站功能性發展方向，比如一家企業營銷型網站，對用戶購買率特別敏感，那麼數據分析就應該以此為核心，進行分析;而對於展示型網站來說，對於用戶留存率特別感興趣，數據分析依據就是興趣，如果是一個靠廣告獲得收益的網站，如何誘導用戶點擊廣告。

網站數據分析有什麼用途

你想要實現什麼目的，數據分析都可以起到輔助支持決策的作用

微信運營數據分析怎麼做？

從用戶方面入手分析包括以下幾點：（微問數據）
1、包括用戶增長統計和用戶屬性統計。
2、用戶增長統計，是按日統計，有4個維度：
3、新關注、取消關注、凈增關注、累積關注。

網站數據分析怎麼樣

挺專業的，站長必備啊~~也就外出用手機關心一下網站流量，要不能在電腦上網，直接後網頁GA，還辛辛苦苦弄3G看多麻煩。

如何通過數據分析解決精細化運營

這個問題問的比較廣泛，你需要的是。如何去了解自己的店鋪的一些數據，然後根據數據結合，改變店鋪的整個布吉。

如何通過統計分析工具做好APP的數據分析和運營

1
行業數據
行業數據對於一個APP來說，至關重要。了解行業數據，可以知道自己的APP在整個行業的水平，可以從新增用戶、活躍用戶、啟動次數、使用時長等多個維度去對比自己產品與行業平均水平的差異以及自己產品的對應的指標在整個行業的排名，從而知道自己產品的不足之處。這種縱向的對比，會讓自己的產品定位、發展方向更加清晰。
2
評估渠道效果
在國內，獲取用戶的渠道是非常多的，如微博、微信、運營商商店、操作系統商店、應用商店、手機廠商預裝、CPA廣告、交叉推廣、限時免費等等。看一個APP的數據，首先要知道用戶從哪裡來，哪裡的用戶質量最高，這樣開發者就會面臨一個選擇和評估渠道的難問題。但是通過統計分析工具，開發者可以從多個維度的數據來對比不同渠道的效果，比如從新增用戶、活躍用戶、次日留存率、單次使用時長等角度對比不同來源的用戶，這樣就可以根據數據找到最適合自身的渠道，從而獲得最好的推廣效果。
3
用戶分析
產品吸引到用戶下載和使用之後，首先要知道的就是用戶是誰。所以，我們需要詳盡地了解到用戶的設備終端類型、網路及運營商、地域的分布特徵。這些數據可以幫助了解用戶的屬性，在產品改進以及產品推廣中，就可以充分利用這些數據制定精準的策略。
4
用戶行為分析
在關注完用戶的屬性後，我們還要高度關注用戶在應用內的行為，因為這些行為最終決定著產品所能夠帶來的價值。開發者可以通過設置自定義事件以及漏斗來關注應用內每一步的轉化率，以及轉化率對收入水平的影響。通過分析事件和漏斗數據，可以針對性的優化轉化率低的步驟，切實提高整體轉化水平。
5
產品受歡迎程度
在了解了用戶的行為之後，我們應該看一下自己的產品是否足夠受歡迎，這是一個應用保持生命力的根本。開發者可以從留存用戶、用戶參與度（使用時長、使用頻率、訪問頁面、使用間隔）等維度評價用戶粘度。進行數據對比分析的時候，要充分利用時間控制項和渠道控制項，可以對比不同時段不同渠道的用戶粘度，了解運營推廣手段對不同渠道的效果。

『陸』在網路時代,如何能做到:既能全面收集客戶信息,同時又能不侵犯客戶隱私

1、盡量利用動態的諸如消費數據，少用只含有聯系電話等靜態數據。盡量利用根據消費數據進行分析、挖掘後產生的數據，將客戶數據抽象作為群體、而不是落實到個人。

2、在掌握客戶資料的情況下，與單個客戶接觸時，要有充分的理由，選擇合適的事情、時間及客戶喜歡的交流方式與客戶接觸。

3、在與客戶交流時，盡量不要透露你的公司已經對客戶的資料了如指掌。

4、採用一定的技術手段，確保客戶數據的安全。要非常重視客戶數據保密。

5、最後最基本的原則還是：在利用客戶數據與客戶接觸時，一定要掌握交流技巧及服務藝術，「不著痕跡」才是市場營銷的最高境界。

(6)如何利用網路技術從網站上下載數據擴展閱讀：

獲取信息的常見方式：

1、觀察法：通過開會、深入現場、參加生產和經營、實地采樣、進行現場觀察並准確記錄（包括測繪、錄音、錄像、拍照、筆錄等）調研情況。

2、實驗法：通過實驗室實驗、現場實驗、計算機模擬實驗、計算機網路環境下人機結合實驗等過程獲取信息或結論。

3、互聯網信息收集法：通過計算機網路發布、傳遞和存儲的各種信息。

4、查閱資料法：報紙、行業網站、文獻、雜志、廣播電視等傳媒專訪。

5、調查法：包括拜訪調查法、電話采訪法、問卷調查法。

6、檢索方法。

7、索取方法。

『柒』如何利用網路跟蹤別人用什麼網站

如何利用網路跟蹤別人用什麼網站
回答：有六種方法可以跟蹤網站，其中包括：

1、Ip 地址：當我們連接到互聯網時，它是我們設備的唯一地址。此地址與我們家或辦公室中的其他聯網設備共享。使用它，網站可以確定我們的大致地理位置。 IP 地址可以更改，因此很難通過長時間使用 IP 地址來跟蹤特定用戶。通過IP地址網站無法追蹤用戶的定位，但可以輕松追蹤所在地區或城市。該程序基本上通過垃圾廣告起作用。
2、HTTP Referrer：每當我們點擊瀏覽器中的任何鏈接時，它都會載入鏈接到它的網頁。網站將被打開，內部信息如IP 地址、位置、網路瀏覽器、機器類型等將提供給鏈接的網站。這稱為HTTP 引薦來源網址。如果您單擊網頁外的鏈接，則該網頁將獲取有關您的信息。假設您單擊「如何跟蹤」鏈接（網頁外部），則該鏈接將看到您來自何處，這稱為 HTTP 引用標頭。
一個網頁可以包含一個跟蹤腳本，它會告訴廣告商您現在正在尋找哪個頁面。
Web bug 是這里最無法追蹤的程序，它們非常小，包含在圖像中，用於郵件中，假設您打開包含圖像的郵件，然後廣告商可以追蹤您。

3、Cookie 和跟蹤腳本： Cookie 是您計算機上的小型文本文件，用於存儲與您的在線習慣相關的一小段信息。 Cookie 還可以識別您的身份並跟蹤您在網站上的活動。跟蹤腳本發送有關您當時正在查看的頁面的信息。
Cookies通常有兩種類型：
第一方 cookie：這些 cookie 存儲我們自己的登錄 ID、密碼、自動填充信息等，用於經常訪問的網站。
第三方 cookie：這些 cookie 存儲我們的瀏覽數據，並根據我們的興趣使用這些 cookie 在我們的網頁上放置廣告。這有時會導致我們的網頁上出現許多不需要的廣告。
4、超級 Cookie：這些也是 cookie（如evercookie ），但具有持久性。它們將數據存儲在多個位置（Flash cookie、Silver light 存儲和 HTML 5 本地存儲等）。如果您刪除其中的一部分，該信息將從其他位置重新填充。假設您從瀏覽器中清除了 cookie，但在 Flash cookie 中沒有清除，那麼瀏覽器將從 Flash cookie 中復制 cookie 並重新填充到您的瀏覽器中，不知何故超級 cookie 就像永遠無法消失的 cookie。
supercookie 的目標是記住每個用戶，如果您清除它將從其他存儲中重新填充的所有 cookie。 supercookie 與備份計劃一起使用。

5、用戶代理：每次我們連接到一個網站時，我們的瀏覽器都會向該網站發送一個用戶代理，該網站從我們這里收集瀏覽器類型、操作系統和重要數據等數據，廣告商使用它們在我們的網頁上定位我們喜歡的廣告看到我們想看到的。
6、瀏覽器指紋：每個瀏覽器都是獨一無二的，這會告訴網站您安裝的字體、插件您在瀏覽器中使用的所有內容。如果您禁用 cookie 以阻止這些事情，那麼這將是跟蹤您的另一種方式，禁用選項將告訴網站您的信息。

『捌』都在說爬蟲，究竟什麼是爬蟲技術啊，爬蟲技術能夠達到什麼效果

就是從別的網站獲取對自己有用的數據
有些是不公開的，因此有可能是無法的

『玖』什麼是網路爬蟲

1、網路爬蟲就是為其提供信息來源的程序，網路爬蟲（又被稱為網頁蜘蛛，網路機器人，在FOAF社區中間，更經常被稱為網頁追逐者），是一種按照一定的規則，自動的抓取萬維網信息的程序或者腳本，已被廣泛應用於互聯網領域。

2、搜索引擎使用網路爬蟲抓取Web網頁、文檔甚至圖片、音頻、視頻等資源，通過相應的索引技術組織這些信息，提供給搜索用戶進行查詢。網路爬蟲也為中小站點的推廣提供了有效的途徑。

拓展資料：

網路爬蟲另外一些不常使用的名字還有螞蟻，自動索引，模擬程序或者蠕蟲。隨著網路的迅速發展，萬維網成為大量信息的載體，如何有效地提取並利用這些信息成為一個巨大的挑戰。

搜索引擎（Search Engine），例如傳統的通用搜索引擎AltaVista，Yahoo！和Google等，作為一個輔助人們檢索信息的工具成為用戶訪問萬維網的入口和指南。但是，這些通用性搜索引擎也存在著一定的局限性，如：

（1）不同領域、不同背景的用戶往往具有不同的檢索目的和需求，通用搜索引擎所返回的結果包含大量用戶不關心的網頁。

（2）通用搜索引擎的目標是盡可能大的網路覆蓋率，有限的搜索引擎伺服器資源與無限的網路數據資源之間的矛盾將進一步加深。

（3）萬維網數據形式的豐富和網路技術的不斷發展，圖片、資料庫、音頻、視頻多媒體等不同數據大量出現，通用搜索引擎往往對這些信息含量密集且具有一定結構的數據無能為力，不能很好地發現和獲取。

（4）通用搜索引擎大多提供基於關鍵字的檢索，難以支持根據語義信息提出的查詢。

『拾』如何獲取並分析一個網站的相關信息

1，網站內部數據
網站內部數據是網站最容易獲取到的數據，它們往往就存放在網站的文件系統或資料庫中，也是與網站本身最為密切相關的數據，是網站分析最常見的數據來源，我們需要好好利用這部分數據。
伺服器日誌
網站分析不再局限於網頁瀏覽的PV、UV，轉化流失等，基於Events的分析將會越來越普遍，將會更多的關注用戶在接受網站服務的整個流程的情況。
隨著網站應用的不斷擴張，以及前端技術的不斷升華。網站日誌不再局限於點擊流的日誌數據，如果你的網站提供上傳下載、視頻音樂、網頁游戲等服務，那麼很明顯，你的網站伺服器產生的絕不僅有用戶瀏覽點擊網頁的日誌，也不只有標準的apache日誌格式日誌，更多的W3C、JSON或自定義格式的輸出日誌也給網站分析提供了新的方向。
網站分析工具
通過網站分析工具獲得數據是一個最為簡便快捷的方式，通過網站分析工具獲得的數據一般都已經經過特殊計算，較為規范，如PV、UV、Exit Rate、Bounce Rate等，再配上一些趨勢圖或比例圖，通過細分、排序等方法讓結果更為直觀。
但通過網站分析工具得到數據也遠不止這些，上面的這些數據也一樣可以通過統計網站日誌獲得，但網站分析工具的優勢在於其能通過一些嵌入頁面的JS代碼獲得一些有趣的結果，如一些網站分析工具提供的點擊熱圖，甚至滑鼠移動軌跡圖。這些分析結果往往對網站優化和用戶行為分析更為有效。
資料庫數據
對於一般的網站來說，存放於資料庫中的數據可以大致分為3個部分：
網站用戶信息，一般提供注冊服務的網站都會將用戶的注冊賬號和填寫的基本信息存放在資料庫裡面；
網站應用或產品數據，就像電子商務的商品詳細信息，如商品信息會包含商品名稱、特徵描述、產品屬性等；
用戶在應用服務或購買產品時產生的數據，最簡單的例子就是電商網站的用戶購買(購買單、報價單、詢盤)數據——購買時間、購買的用戶、購買的商品、購買數量、支付的金額等。
當然，這一部分數據的具體形式會根據網站的運營模式存在較大差異，一些業務范圍很廣，提供多樣服務的網站其資料庫中數據的組合會相當復雜。
其它
其它一切網站運營過程中產生的數據，有可能是用戶創造，也有可能是網站內部創造，其中有一大部分我們可以稱其為「線下數據」。
2，外部數據
網站分析除了可以從網站內部獲取數據以外，通過互聯網這個開放的環境，從網站外部獲取一些數據可以讓分析的結果更加全面。
互聯網環境數據
可以去一些網路數據分析平台查一下互聯網中頂級網站的訪問量趨勢。
競爭對手數據
時刻關注競爭對手的情況可以讓你的網站不至於在競爭中落伍。除了一些網站數據查詢平台以外，直接從競爭對手網站上獲取數據也是另外一條有效的途徑，也有網站會出於某些原因（信息透明、數據展示等）將自己的部分統計信息展現在網站上，看看那些數據對於掌握你的競爭對手的情況是否有幫助。
在獲取上述幾類數據的同時，也許我們還可以從其他方面獲取一些更為豐富的數據。
合作夥伴數據
如果你有合作的網站或者你經營的是一個電子商務網站，也許你會有相關的產品提供商、物流供應商等合作夥伴，看看他們能為你提供些什麼數據。
用戶數據
如果你的網站已經小有名氣，那麼嘗試在搜索引擎看看用戶是怎麼評價你的網站，或者通過SNS網站等看看用戶正在上面發表什麼關於你的網站的言論。
當然通過用戶調研獲取數據是另外一個不錯的途徑，通過網站上的調查問卷或者線下的用戶回訪，電話、IM調查，可用性實驗測試等方式可以獲取一些用戶對網站的直觀感受和真實評價，這些數據往往是十分有價值的，也是普通的網站分析工具所獲取不到的。

在分析網站的外部數據的時候，需要注意的是不要過於相信數據，外部數據相比內部數據不確定性會比較高。網站內部數據即使也不準確，但我們至少能知道數據的誤差大概會有多大，是什麼原因造成了數據存在誤差。而外部數據一般都是有其他網站或機構公布的，每個公司，無論是數據平台、咨詢公司還是合作夥伴都可能會為了某些利益而使其公布的數據更加可信或更具一定的偏向性，所以我們在分析外部數據是需要更加嚴格的驗證和深入的分析。而對於用戶調研中獲取的數據，我們一般會通過統計學的方法檢驗數據是否可以被接受，或者是否滿足一定的置信區間，這是進行數據分析前必須完成的一步。

導航:首頁 > 網路數據 > 如何利用網路技術從網站上下載數據

如何利用網路技術從網站上下載數據

網站運營數據分析通過什麼途徑？

B2C網站運營每周數據分析那些指標

如何快速入門網站數據分析與運營

通過網站數據分析,對網路營銷起到什麼作用?

網站運營怎麼能缺少數據統計怎樣的數據分析最有效

網站數據分析有什麼用途

微信運營數據分析怎麼做？

網站數據分析怎麼樣

如何通過數據分析解決精細化運營

如何通過統計分析工具做好APP的數據分析和運營

拓展資料：

與如何利用網路技術從網站上下載數據相關的資料

友情鏈接

導航:首頁 > 網路數據 > 如何利用網路技術從網站上下載數據

如何利用網路技術從網站上下載數據

網站運營數據分析通過什麼途徑？

B2C網站運營每周數據分析那些指標

如何快速入門網站數據分析與運營

通過網站數據分析,對網路營銷起到什麼作用?

網站運營怎麼能缺少數據統計 怎樣的數據分析最有效

網站數據分析有什麼用途

微信運營數據分析怎麼做？

網站數據分析怎麼樣

如何通過數據分析解決精細化運營

如何通過統計分析工具做好APP的數據分析和運營

拓展資料：

與如何利用網路技術從網站上下載數據相關的資料

友情鏈接

網站運營怎麼能缺少數據統計怎樣的數據分析最有效