① 如何對區域網內的多台linux進行集群化管理
它非常適合用來快速配置一個集群中的所有運行相同服務和具備相同配置的計算機節點。現在有大量的開源管理工具,都可以實現這樣的管理,比如dsh、SUSE Manager等。下面是用ClusterSSH管理多台Linux伺服器的具體過程。
如果你是一名Linux系統管理員,那你每天一定會和許許多多的機器打交道,因為你要定期監測和維護這些機器,如一批Web伺服器,如果你要同時在多台機器上敲入相同的命令,你可能會通過SSH登錄,然後逐台敲入,如果使用ClusterSSH,可以為你節省不少類似的工作時間。
ClusterSSH是用Tk/Perl包裝XTerm和SSH後形成的新工具,就其本身而言,它可以運行在任何兼容POSIX的操作系統上,我曾經在Linux,Solaris和Mac OS X上運行過它,它需要Perl庫Tk(在Debian或Ubuntu上就是perl-tk)和X11::Protocol(在Debian或Ubuntu上就是libx11-protocol-perl),此外,xterm和OpenSSH是必不可少的。
安裝在Debian或Ubuntu上安裝ClusterSSH是相當簡單的,只需要敲入sudo apt-get install clusterssh就可以安裝好,至於依賴包你也不必擔心,一切都會為你裝好的,它也提供了適合Fedora的rpm包,在FreeBSD上可通過port系統安裝,還為Mac OS X准備了MacPort版本,因此你可以在你的蘋果電腦上安裝ClusterSSH,當然,如果你是極客,也可以下載源代碼自己編譯。
配置可以通過ClusterSSH的全局配置文件/etc/clusters,或用戶home目錄下的。csshrc文件來配置它,我喜歡用戶級的配置方式,這樣同一個系統中的不同用戶可以根據自己的喜好進行配置,ClusterSSH定義了一個「cluster」機器組,你可以通過一個界面來控制這個組中的所有機器,在配置文件的頂端「clusters」部分,你可以詳盡地列出你的集群,然後用獨立的段落來描述每個集群。
例如,假設我有兩個集群,每個集群由兩台機器組成,「Cluster1」由「Test1」和「Test2」兩台機器組成,「Cluster2」由「Test3」和「Test4」兩台機器組成,~.csshrc(或/etc/clusters)配置文件的內容看起來應該是:
clusters = cluster1 cluster2
cluster1 = test1 test2
cluster2 = test3 test4你也可以創建中間集群(包含其它集群的集群),如果你想創建一個名叫「all」的集群包含所有的機器,有兩種實現手段,首先,你可以創建一個包含所有機器的集群,如:
clusters = cluster1 cluster2 all
cluster1 = test1 test2
cluster2 = test3 test4
all = test1 test2 test3 test4但我更喜歡的方法是使用一個包含其它集群的中間集群:
clusters = cluster1 cluster2 allcluster1 = test1 test2
② 基於linux 的 並行計算的集群。 詳細步驟 謝謝
先申明哈,內容是復制博友的。希望對你有幫助!linux集群中MPI的並行計算環境的簡單配置
MPI的安裝及簡單測試
MPI有多種實現版本,如Argonne國家實驗室開發的MPICH,Edinburgh開發的CHIMP以及Ohio State University開發的LAM/MPI。其中MPICH是一種最重要的MPI實現,它可以從網上免費獲得Linux和Windows版本。它的開發和MPI規范的制定是同步的,因此最能反映MPI的變化和發展,MPICH由此成為實現MPI的最成熟和最廣泛使用的版本。本文安裝的MPI軟版本為MPICH-1.2.6。
安裝步驟:
1、從網上下載MPICH壓縮包(mpich.tar.gz)
2、解壓:# tar zxvf mpich.tar.gz
3、進入解壓後的目錄: # cd mpich-1.2.6
4、配置: # ./configure –prefix=/usr/local/mpich
其中/usr/local/mpich為軟體所安裝的目錄
5、編譯 # make
6、安裝 # make install
7、配置該軟體的用戶搜索路徑
Root 用戶下:修改/etc/profile 加入
PATH=$PATH:/usr/local/mpich/bin
MANPATH=$MANPATH:/usr/local/mpich/man
Export PATH MANPATH
普通用戶下:修改~/.bash_profile 加入
export PATH=$PATH:/usr/local/mpich/bin
8、修改/usr/local/mpich/share/machines.LINUX文件,加入集群中可以用來做並行計算的主機名(八節點集群為例)
加入的內容為:
server
pc1
pc2
pc3
pc4
pc5
pc6
pc7
9、MPI環境的簡單測試
在伺服器節點上,以mpich 自帶的計算PI值的並行計算程序cpi對所搭建的集群環境做簡單的測試。
步驟:
在/usr/local/mpich/example目錄下
1 編譯 # make cpi
2 啟動並行計算 # mpirun –np N cpi (其中N 為節點機的個數)
可以看到PI值及誤差和計算時間,說明環境搭建基本成功。至此,所組建的MPI集群基本成功。
③ 什麼是Linux集群
集群通信系統復是一種制計算機系統, 它通過一組鬆散集成的計算機軟體和/或硬體連接起來高度緊密地協作完成計算工作。簡單地說,集群(cluster)就是一組計算機,它們作為一個整體向用戶提供一組網路資源。這些單個的計算機系統就是集群的節點(node)。一個理想的集群,用戶是不會意識到集群系統底層的節點的。在他們看來,集群是一個系統,而非多個計算機系統。並且集群系統的管理員可以隨意增加和刪改集群系統的節點。
集群已不是一個全新的概念,早在七十年代計算機廠商和研究機構就對集群系統進行了研究和開發。這些系統不為大家熟知,是因為它主要用於科學工程計算。直到Linux集群的出現,集群的概念才得以廣泛傳播。集群系統主要分為高可用(High Availability)集群,簡稱HA集群,和高性能計算(High Perfermance Computing)集群,簡稱HPC集群。
④ 如何分分鍾創建Linux虛擬集群
首先需要有兩個Red Hat Enterprise Linux或CentOS 7節點,並配置正確的轉發及反向域名系統,由於Red Hat 6及7之間有些變化,顯著降低了集群管理的復雜度。
集群設置主要依靠兩種技術:Pacemaker 和 Corosync。Pacemaker運行集群管理端,Corosync管理更低級別的集群項目以確保連通性。
使用如下命令同時安裝Pacemaker 和 Corosync:
yum install –y pcs fence-agents-all
該命令將會下載配置集群所需要的所有依賴包,請注意必須在兩個節點上執行上述命令。
你還需要增加一個防火牆規則以允許通過必需的流量。只需要運行如下命令:
firewall-cmd --permanent --add-service=high-availability
firewall-cmd --permanent --add-service=http
firewall-cmd --reload
啟動集群設備
接下來的步驟是啟用並啟動集群服務。需要運行如下命令:
systemctl enable pcsd.service
systemctl start pcsd.service
第一行命令在啟動時啟用集群服務,第二行命令在當前會話啟動集群服務。
圖A 啟用並開啟集群服務
如果你有興趣,可以查看/var/logs/cluster/目錄下日誌確認發生了什麼。此時,我們已經啟動了集群服務,但還沒有真正構建集群設置。
採用最新版本的RHEL或CentOS,可以在命令行下使用pcs命令——「Pacemaker/Corosync配置系統」的簡稱——直接進行配置,這比之前的安裝過程更簡單。
安裝完集群配置後,創建了一個名為hacluster的用戶管理虛擬集群。為了能夠使用該賬號,必須更改密碼,因此在兩個節點上使用如下命令重置密碼:passwd hacluster
管理虛擬集群
完成上述配置後,就可以開始管理虛擬集群與節點了。第一個步驟是授權包含在虛擬集群中的節點。命令如下:pcs cluster auth node1 node2
如果一切按計劃進行,屏幕看起來應該與圖B類似。
圖B 授權集群節點
創建集群資源
下一個步驟是創建集群資源。可以使用pcs cluster setup命令創建集群資源:pcs cluster setup --start --name myapp node1 node2
此時,集群資源控制器將刷新現有配置,同步新配置數據並構建一個包括兩個指定節點的新配置。接下來就是使用如下命令啟用虛擬集群: pcs cluster enable --all
結果應該會顯示兩個節點已經啟用了。為檢查整個集群的狀態,可以使用命令pcs cluster status,該命令將顯示當前集群狀態的概要信息。
圖C 檢查當前集群狀態
理解共享存儲的作用
在處理虛擬集群節點時需要牢記的一個重要事項是確保已關閉了hypervisor級的文件鎖定系統。不這樣做可能會帶來很多問題,包括導致有問題的磁碟變為只讀的。應該在操作系統級完成鎖定。為覆蓋該設置,請檢查hypervisor文檔。
在本示例中,我們僅設置相關配置。我們需要做的一件事是對伺服器如何決定虛擬集群內什麼是「活的」以及什麼是「死的」進行管理。這可以通過稱之為fencing的進程完成。當節點沒有完全出故障並出現問題時,Fencing允許每個節點停止其他節點以保持集群的完整性。
沒有有效的fencing配置,客戶端將無法啟動。fencing命令是pcs stonith。stonith是「關閉其他節點」首字母的縮略詞,是一個能夠關閉未在正常運行的節點的Linux服務。
有一些fence方法可用,但我們在示例中使用的是內置的虛擬fencing方法。在任何一個節點上運行如下命令:
pcs stonith create newfence fence_virt pcmk_host_list=f1
此時,我們可以使用如下命令重新啟用集群組件:pcs cluster start --all
如果你使用的是pcs status命令,應該顯示正在正常運行的服務。
啟用虛擬IP
完成上述配置後,我們需要啟用虛擬IP。虛擬IP是沒有物理連接的地址。其用意是充當虛擬集群提供服務的容錯前端。例如,如果一個節點出故障,不需要任何手動配置或者明顯的停機時間,所有的流量將會路由到另一個集群節點。
根據需要取代如下命令中的IP地址,然後執行:
pcs resource create Cluster_VIP ocf:heartbeat:IPaddr2 ip=192.168.0.100 cidr_netmask=24 op monitor interval=20s
集群現在應該處於活動狀態。在開始使用集群前你需要增加集群資源。
需要解決更多linux問題,詳情請看 http://www.linuxprobe.com/chapter-00.html
望採納