❶ 如何使用Big SQL訪問大數據使用詳解
使用 JDBC/ODBC 程序訪問 Big SQL
我們可以使用 JDBC/ODBC 程序來訪問 Big SQL,我們以 JDBC 程序為例,詳細介紹了使用 JDBC 訪問 Big SQL 的具體方法。
首先,我們需要在 CLASSPATH 環境變數中增加 bigsql-jdbc-driver.jar 文件,如下所示:
清單 8. 增加 CLASSPATH 環境變數
biadmin@imtebi1:/opt/ibm/biginsights/bigsql/samples/queries>
export CLASSPATH=$CLASSPATH:/opt/ibm/biginsights/bigsql/samples/queries/bigsql-jdbc-driver.jar
並創建 countbrand.java 程序,如下所示:
清單 9. countbrand.java 程序
countbrand.java
import java.io.*;
import java.sql.*;
import java.util.*;
class countbrand {
public static void main(String args[]) throws SQLException,Exception {
try {
//load the driver class
Class.forName("com.ibm.biginsights.bigsql.jdbc.BigSQLDriver");
} catch (ClassNotFoundException e) {
System.out.print(e); }
try {
//set connection properties
String user="biadmin";
String password="password";
Connection con = DriverManager.getConnection("jdbc:bigsql://172.16.42.202:7052/gosalesdw",
user,password);
Statement st = con.createStatement();
//query execution
ResultSet rs = st.executeQuery("SELECT count(*) FROM GOSALESDW.GO_BRANCH_DIM AS BD,
GOSALESDW.DIST_INVENTORY_FACT AS IF WHERE IF.BRANCH_KEY = BD.BRANCH_KEY /*+ joinMethod = 'mapSideHash',
buildTable = 'bd' +*/ AND BD.BRANCH_CODE > 20");
while(rs.next()) {
System.out.println(rs.getString(1));
}
} catch(SQLException sqle)
{ System.out.print(sqle); }
}
}
我們可以使用如下命令編譯並運行 countbrand.java 程序,如下所示:
清單 10. 編譯並運行 countbrand.java 程序
biadmin@imtebi1:/opt/ibm/biginsights/bigsql/samples/queries> javac countbrand.java
biadmin@imtebi1:/opt/ibm/biginsights/bigsql/samples/queries> java countbrand
33318
創建、載入表
同關系資料庫一樣,Big SQL 也存在模式。模式是指一組對象的集合,我們可以通過創建不同的模式來組織 Big SQL 中的數據對象。如下所示,我們創建 gosalesdw 模式來組織我們需要創建的 Hive 及 HBase 表。
清單 11. 創建 gosalesdw 模式
biadmin@imtebi1:/opt/> $BIGSQL_HOME/bin/jsqsh -U biadmin -P password
JSqsh Release 1.5-ibm, Copyright (C) 2007-2013, Scott C. Gray
Type \help for available help topics. Using JLine.
[localhost][biadmin] 1> create schema if not exists gosalesdw;
0 rows affected (total: 1m4.56s)
[localhost][biadmin] 1> quit;
biadmin@imtebi1:/opt/$HADOOP_HOME/bin/hadoop fs -ls /biginsights/hive/warehouse
drwxr-xr-x - biadmin biadmgrp
0 2013-12-21 21:20 /biginsights/hive/warehouse/gosalesdw.db
在 Big SQL 中,我們創建的模式會在 DFS 分布式文件系統中創建一個相應的目錄,該目錄可以在創建模式時指定,如果沒有指定目錄,會在 Hive 的默認目錄 /biginsights/hive/warehouse/ 下創建。我們可以通過修改 $HIVE_HOME/conf/hive-site.xml 文件中的 hive.metastore.warehouse.dir 屬性值來修改 Hive 的默認存儲路徑,如下所示:
清單 12. 修改 hive-site.xml
biadmin@imtebi1:/opt/> $BIGSQL_HOME/bin/jsqsh -U biadmin -P password
JSqsh Release 1.5-ibm, Copyright (C) 2007-2013, Scott C. Gray
Type \help for available help topics. Using JLine.
[localhost][biadmin] 1> create schema if not exists gosalesdw1 location
'/usr/biadmin/gosalesdw1.db';
0 rows affected (total: 0.87s)
[localhost][biadmin] 1> quit
biadmin@imtebi1:/opt/> $HADOOP_HOME/bin/hadoop fs -ls /usr/biadmin
Found 1 items
drwxr-xr-x - biadmin supergroup 0 2013-12-21 21:26 /usr/biadmin/gosalesdw1.db
more $HIVE_HOME/conf/hive-site.xml
hive.metastore.warehouse.dir
/biginsights/hive/warehouse
❷ 如何運行JAVA
第一步:下載並安裝JDK 6.0,安裝路勁為: C:\java\jdk1.6 .
第二步:對「我的電腦」按右鍵,選「屬性」,在「系統屬性」窗口中選「高級」標簽,再按「環境變數」按鈕,彈出一個「環境變數」的窗口,在系統變數中新建一個變數,變數名為「JAVA_HOME「,變數值為"C:\java\jdk1.6";如果存在"PATH"變數名,按編輯,在變數值最前面輸入"C:\java\jdk1.6\bin;".(注意以分號結尾,沒有引號.如果沒有"PATH",點擊新建一個"PATH"變數名,變數值一樣).
第三步:單擊Windows xp的「開始」->「運行」,在彈出的運行窗口中輸入cmd,按回車,打開一個命令行窗口,輸入javac,將會看見一系列javac常用參數選項. 恭喜你java環境安裝成功了.
第四步:開始編程(注意先雙擊打開"我的電腦",在"工具" ->"文件夾選項" -> 點擊"查看"選項 ->在"高級設置"中找到"隱藏已知文件類型的擴展名"前面的小勾去掉)。在C盤的根目錄中新建一個子目錄,名為"JavaTest」,以作為存放 Java源代碼的地方。在JavaTest文件夾中,新建文本文檔, 把「新建 文本文檔.txt」改為"HelloWorld.java"。用記事本打開"HelloWorld.java", 輸入:
public class HelloWorld {
public static void main(String[] args) {
System.out.println("Hello, world!");
System.out.println("恭喜你成功運行了第一個java應用程序!");
}
}
注意源文件名必須與類名相同,且類修飾符為public,文件名後綴為".java".保存文件.
第五步:在命令行窗口中輸入 cd C:\JavaTest,將當前路徑轉入JavaTest目錄中。然後,輸入 javac HelloWorld.java,JDK就在JavaTest文件夾中編譯生成一個HelloWorld.class的類文件。
第六步:在命令行窗口中輸入 java HelloWorld,(注意沒有.class後綴)屏幕出現了
Hello world!
恭喜你成功運行了第一個java應用程序!
表示成功了,也就順利地編譯及運行了第一個Java應用程序。
❸ 大數據需要掌握哪些技能
大數據學什麼
大數據需要掌握的內容包括8個方面,你可以根據這個路線圖的順序學習,選擇培訓機構的時候重點關注機構的口碑,希望你早日學有所成。
❹ 大數據培訓內容,大數據要學哪些課程
java
數據結構、關系型資料庫、linux系統操作
hadoop離線分析、Storm實時計算、spark內存計算
❺ java大數據主要學習什麼
大數據是一個概念性的東西,指代海量的數據資源;java是語言開發工具,Java是學習大數據技術的基礎,大數據技術還包含了Hadoop、spark、storm等體系,java不等於大數據。只不過Hadoop是用Java寫的,所以學習Hadoop,最好能有一點Java的基礎。
❻ 大數據培訓到底是培訓什麼
大數據培訓,目前主要有兩種:
1、大數據開發
數據工程師建設和優化系統。學內習hadoop、spark、storm、超大集群容調優、機器學習、Docker容器引擎、ElasticSearch、並發編程等;
2、數據分析與挖掘
一般工作包括數據清洗,執行分析和數據可視化。學習Python、資料庫、網路爬蟲、數據分析與處理等。
大數據培訓一般是指大數據開發培訓。
大數據技術龐大復雜,基礎的技術包含數據的採集、數據預處理、分布式存儲、資料庫、數據倉庫、機器學習、並行計算、可視化等各種技術范疇和不同的技術層面。
❼ 大數據必學的Java基礎有哪些
遠標教育為你解答:
初識Java
1java發展簡史,主要特徵
2java運行機制
3第一個Java程序,注釋
4javac,java,javadoc等命令
5標識符與關鍵字
6變數的聲明,初始化與應用
數據類型與運算符
1數據類型(基本,引用)
2類型轉換
3轉義字元
4Java運算符與表達式
流程式控制制
1選擇控制語句if-else,
2選擇控制語句switch-case
3循環控制語句while
4循環控制語句do-while
5循環控制語句for與增強型for
循環控制與數組
1循環控制break,continue與return
2循環標簽
3數組的聲明與初始化
4二維(多維)數組
5main方法命令行參數
類與對象
1面向對象的基本思想
2類與對象(聲明,創建,使用)
3成員變數與方法(聲明與應用)
4參數傳遞(基本數據類型與引用類型)
方法重載
1方法重載
2構造器
3構造器重載
4this的使用
訪問許可權
1包的使用(package,import)
2訪問許可權修飾符
3類的封裝性(私有化,seter與geter)
4static(靜態成員變數,方法,類)
5final(修飾變數,方法,類)
繼承
1類的繼承概念
2成員繼承
3super的使用
4調用父類構造器
多態
1方法的重寫與隱藏
2變數的隱藏
3利用繼承實現多態
4繼承下的類型轉換
5instanceof
抽象類
1抽象類
2抽象方法
3繼承抽象類
4抽象類與多態
介面
1介面概念與使用
2利用介面實現多態性
3介面與抽象類對比
4註解
內部類
1靜態內部類
2成員內部類
3方法內部類(本地類)
4匿名內部類
5eclipse集成開發環境
常用類
1包裝類
2String,StringBuilder,StringBuffer
3Math,Date,Calendar,Random,Scanner
異常處理
1異常處理概念
2try-catch-finally
3throwthrows
4自定義異常
集合(上)
1泛型基本介紹與優勢
2類型通配符
3泛型類與泛型方法
4Collection介面
集合(下)
1List介面及實現類
2Set介面及實現類
3Map介面及實現類
IO流
1File類的使用位元組流(InputStream與OutputStream)的使用
2字元流(Reader與Writer)的使用
3緩存流BufferedReader與BufferedWriter
反射
1類載入,鏈接與初始化
2ClassLoader的使用
3Class類的使用
4通過反射創建類的實例
多線程
1Thead創建線程
2Runnable介面創建線程
3線程的相關方法
4線程同步(wait,notify,notifyall)
5線程死鎖
MySQL基本操作
1資料庫,表結構相關概念
2MySQL資料庫的配置與操作
3MyManagerLite
4三種注釋
5MySQL數據類型
6表的相關操作
7查詢數據(單表,多表),where條件
8插入,修改,刪除數據
9別名使用
常用函數與內外連接
1流程式控制制相關函數if,case等
2常用字元串處理函數
3聚合函數與groupby子句
4分組過濾having
5排序orderby
6內連接cross(inner,natural)join
7using
8外連接left(right)outerjoin
JDBC
1JDBC概念
2java.sql相關介面
3JDBC資料庫連接MySQL
4資料庫連接池
html&css
1.html簡介
2.html結構
3.html標簽
4.html應用
5.css簡介
6.css常用選擇器
7.css應用
javascript
1.javascript簡介
2.javascript數據類型
3.javascript流程式控制制
4.javascript編程
5.json對象簡介及應用
6.jQuery簡介及應用
Servlet&Jsp
1.Servlet簡介
2.Servlet介面
3.Servlet生命周期
4.Servlet編程
5.jsp簡介
6.jsp標簽
7.jsp編程