導航:首頁 > 網路數據 > 大數據工程師筆試題

大數據工程師筆試題

發布時間:2023-08-28 21:23:11

① 求恆生電子 軟體運維工程師,資料庫筆試題!!!

1、寫C語言的拷貝函數,要求復制字元串,並且將復制後的字元串逆序
比如form中是1234, 則to中是4321
void strcyp(char * to,const char * form)
不能使用庫函數 不能定義其他的變數
最佳答案
int main()
{
char a[10],b[10];
printf("請輸入a字元可以隨意輸入小於10個字元")
/*這里不知道為什麼查過10個就前面一部分對
且a字元串就沒有值了你可以自己事實*/
scanf("%s",a);
printf("a字元串:%s\n",a);
turnto(a,b);
printf("b字元串:%s\n",b);
printf("a字元串:%s\n",a);
return 0;
}
void turnto(char *q,char *p)
{
int length,i,j;
for(length=0;;length++)
{
if(q[length]=='\0')
break;
}
j=length-1;
for(i=0;i
{
// *(p+i)=*(q+(j--));
p[i]=q[j--];
}
// *(p+i)='\0';
p[i]='\0';
}
第一個編程題:
827328929 數字反轉,不能使用類庫,不能使用數組。
第二個編程題:
public int[] getNum(aArray[] ,bArray[]){ }
求出數組aArray[] ,和bArray[]兩個數組的交集,交集放在數組中返回。
資料庫題目:
學生表(student){學好,姓名,年齡,所在系}
課程表(course){課程編號,課程名,學分}
關系表(sc){學號,課程編號,成績}
1、查詢出選修了「資料庫」的學生姓名。
2、查詢平均成績大於85分的學生姓名和平均成績(悲劇的沒有寫出來)
3、添加一個課程信息(「Java」,』1001『,2)
4、添加一個唯一索引
5、在學生表中添加身份證列,大小18,非空

② 從數據分析師考試之筆試試題看職業要求

從數據分析師考試之筆試試題看職業要求

一、異常值是指什麼?請列舉1種識別連續型變數異常值的方法?
異常值(Outlier) 是指樣本中的個別值,其數值明顯偏離所屬樣本的其餘觀測值。在數理統計里一般是指一組觀測值中與平均值的偏差超過兩倍標准差的測定值。
Grubbs』 test(是以Frank E. Grubbs命名的),又叫maximum normed resial test,是一種用於單變數數據集異常值識別的統計檢測,它假定數據集來自正態分布的總體。
未知總體標准差σ,在五種檢驗法中,優劣次序為:t檢驗法、格拉布斯檢驗法、峰度檢驗法、狄克遜檢驗法、偏度檢驗法。
點評:考察的內容是統計學基礎功底。
二、什麼是聚類分析?聚類演算法有哪幾種?請選擇一種詳細描述其計算原理和步驟。
聚類分析(cluster analysis)是一組將研究對象分為相對同質的群組(clusters)的統計分析技術。 聚類分析也叫分類分析(classification analysis)或數值分類(numerical taxonomy)。聚類與分類的不同在於,聚類所要求劃分的類是未知的。
聚類分析計算方法主要有: 層次的方法(hierarchical method)、劃分方法(partitioning method)、基於密度的方法(density-based method)、基於網格的方法(grid-based method)、基於模型的方法(model-based method)等。其中,前兩種演算法是利用統計學定義的距離進行度量。
k-means 演算法的工作過程說明如下:首先從n個數據對象任意選擇 k 個對象作為初始聚類中心;而對於所剩下其它對象,則根據它們與這些聚類中心的相似度(距離),分別將它們分配給與其最相似的(聚類中心所代表的)聚類;然 後再計算每個所獲新聚類的聚類中心(該聚類中所有對象的均值);不斷重復這一過程直到標准測度函數開始收斂為止。一般都採用均方差作為標准測度函數. k個聚類具有以下特點:各聚類本身盡可能的緊湊,而各聚類之間盡可能的分開。
其流程如下:
(1)從 n個數據對象任意選擇 k 個對象作為初始聚類中心;
(2)根據每個聚類對象的均值(中心對象),計算每個對象與這些中心對象的距離;並根據最小距離重新對相應對象進行劃分;
(3)重新計算每個(有變化)聚類的均值(中心對象);
(4)循環(2)、(3)直到每個聚類不再發生變化為止(標准測量函數收斂)。
優點:本演算法確定的K 個劃分到達平方誤差最小。當聚類是密集的,且類與類之間區別明顯時,效果較好。對於處理大數據集,這個演算法是相對可伸縮和高效的,計算的復雜度為 O(NKt),其中N是數據對象的數目,t是迭代的次數。一般來說,K<<N,t<<N 。
缺點:1. K 是事先給定的,但非常難以選定;2. 初始聚類中心的選擇對聚類結果有較大的影響。
點評:考察的內容是常用數據分析方法,做數據分析一定要理解數據分析演算法、應用場景、使用過程、以及優缺點。
三、根據要求寫出SQL
表A結構如下:
Member_ID (用戶的ID,字元型)
Log_time (用戶訪問頁面時間,日期型(只有一天的數據))
URL (訪問的頁面地址,字元型)
要求:提取出每個用戶訪問的第一個URL(按時間最早),形成一個新表(新表名為B,表結構和表A一致)
create table B as select Member_ID, min(Log_time), URL from A group by Member_ID ;
點評:SQL語句,簡單的數據獲取能力,包括表查詢、關聯、匯總、函數等。
另外,這個答案其實是不對的,實現有很多方法,就不貼出來了,大家自己去發揮吧。
四、銷售數據分析
以下是一家B2C電子商務網站的一周銷售數據,該網站主要用戶群是辦公室女性,銷售額主要集中在5種產品上,如果你是這家公司的分析師,
a) 從數據中,你看到了什麼問題?你覺得背後的原因是什麼?
b) 如果你的老闆要求你提出一個運營改進計劃,你會怎麼做?
表如下:一組每天某網站的銷售數據
a) 從這一周的數據可以看出,周末的銷售額明顯偏低。這其中的原因,可以從兩個角度來看:站在消費者的角度,周末可能不用上班,因而也沒有購買該產品的慾望;站在產品的角度來看,該產品不能在周末的時候引起消費者足夠的注意力。
b) 針對該問題背後的兩方面原因,我的運營改進計劃也分兩方面:一是,針對消費者周末沒有購買慾望的心理,進行引導提醒消費者周末就應該准備好該產品;二是,通過該產品的一些類似於打折促銷等活動來提升該產品在周末的人氣和購買力。
點評:數據解讀能力,獲取數據是基本功,僅僅有數據獲取能力是不夠的,其次是對數據的解讀能力。
五、用戶調研
某公司針對A、B、C三類客戶,提出了一種統一的改進計劃,用於提升客戶的周消費次數,需要你來制定一個事前試驗方案,來支持決策,請你思考下列問題:
a) 試驗需要為決策提供什麼樣的信息?
c) 按照上述目的,請寫出你的數據抽樣方法、需要採集的數據指標項,以及你選擇的統計方法。
a) 試驗要能證明該改進計劃能顯著提升A、B、C三類客戶的周消費次數。
b) 根據三類客戶的數量,採用分層比例抽樣;
需要採集的數據指標項有:客戶類別,改進計劃前周消費次數,改進計劃後周消費次數;
選用統計方法為:分別針對A、B、C三類客戶,進行改進前和後的周消費次數的,兩獨立樣本T-檢驗(two-sample t-test)。
點評:業務理解能力和數據分析思路,這是數據分析的核心競爭力。
綜上所述:一個合格的數據分析應該具備統計學基礎知識、數據分析方法、數據獲取、數據解讀和業務理解、數據分析思想幾個方面能力。

③ 美國大數據工程師面試攻略有哪些

WEB前端主要包括3方面:HTML css Java。面試也會圍繞這些提問。你如果是在國外面試,可能問題會更前沿一些。ITjob官網有WEB前端的知識和相關面試題,很多論壇和貼吧也會做相關的解說。下面貼上部分面試題以供參考。希望能幫到你。
HTML
Doctype作用?嚴格模式與混雜模式如何區分?它們有何意義?
HTML5 為什麼只需要寫 <!DOCTYPE HTML>?
行內元素有哪些?塊級元素有哪些? 空(void)元素有那些?
頁面導入樣式時,使用link和@import有什麼區別?
常見的瀏覽器內核有哪些?
html5有哪些新特性、移除了那些元素?如何處理HTML5新標簽的瀏覽器兼容問題?如何區分 HTML 和 HTML5?
簡述一下你對HTML語義化的理解?

css

介紹一下標準的CSS的盒子模型?與低版本IE的盒子模型有什麼不同的?
CSS選擇符有哪些?哪些屬性可以繼承?
CSS優先順序演算法如何計算?
如何居中div?如何居中一個浮動元素?如何讓絕對定位的div居中?
display有哪些值?說明他們的作用。
position的值relative和absolute定位原點是?
CSS3有哪些新特性?
請解釋一下CSS3的Flexbox(彈性盒布局模型),以及適用場景?

JavaScript
介紹JavaScript的基本數據類型。
說說寫JavaScript的基本規范?
JavaScript原型,原型鏈 ? 有什麼特點?
JavaScript有幾種類型的值?(堆:原始數據類型和 棧:引用數據類型),你能畫一下他們的內存圖嗎?
Javascript作用鏈域?
談談This對象的理解。
eval是做什麼的?
什麼是window對象? 什麼是document對象?
null,undefined的區別?
寫一個通用的事件偵聽器函數(機試題)。

④ Python面試數據分析,爬蟲和深度學習一般都問什麼問題,筆試題目考哪些

一面: 技術面試

面試官是一個比較老練的技術總監,貌似80後:

  1. 你先簡單做個自我介紹吧。

答:恩,好的,面試官你好,很高興能來到貴公司面試爬蟲工程師一職。我叫XXX,來自於***,畢業於****大學,**學歷。(如果專業不是計算機專業,就不要介紹自己的專業,如果是大專以下學歷,也不要說自己學歷,揚長避短這個道理大家應該都懂得)有2年多爬蟲工作經驗(如果真實是1年多,就說2年,如果真實是2年多就說3年),工作過2家公司(公司盡量不要說太多,如果2-3年經驗說2家就好,以免說的過多讓人覺得這人太容易干一段不幹,說的太少,可能在一個公司技術積累比較單一),第一家是從實習開始工作的。我就主要介紹下我上家公司的情況吧。我上家公司是****,是一家外包公司(如果是培訓班畢業的盡可能說外包,因為在外包公司,任何項目都可能做,方便後面很多問題的解釋),我在這家公司做了一年多,這家公司在****。我們這家公司是共有50多人。我在裡面負責公司的數據採集爬取,數據處理,繪圖分析等(爬蟲爬下來的數據很多都會進行一些清洗,可以把自己數據處理,繪圖的經驗說出來,增加優勢,如果沒有的話,就業余花時間去學習這方面,常規的方法都不難)。期間主要負責了集團對一些招聘網站、電商網站、金融網站、汽車網站(如果是單一業務的公司,你可能就說不了這么多種類了,一般採集的數據都會比較單一,這就體現了說外包的好處)。我之所以在上家公司離職是因為上家的公司項目基本都已經做完上線了,後面又接的項目感覺挑戰性不大,希望尋找一個平台做更多的項目(這個離職原因因人而異,如果換城市的話也可以簡單粗暴說我家人、朋友在這邊,如果還是同一個城市的話也可以按照我的那樣說,也可以其他方式,但是建議不要說公司經營不好之類的,不喜歡這家公司等等,經營不好可能跟公司員工也有關系,如果回答不喜歡上家公司,面試官會接著問,為什麼不喜歡,如果我們公司也是這種情況,你會不喜歡嗎,面試offer幾率就會大大減少)。因為來之前了解過貴公司,現在主要做金融數據採集的任務,後面也會進行一些大數據分析的工作,覺得項目規劃很有遠見就過來了。(面試前先查下公司底細,知己知彼)因為我在之前公司做過爬蟲、分析方面的工作,貴公司的這個項目也剛好是處於初期階段,我非常喜歡貴公司的這些項目。並且我認為我有能力將貴公司的項目做好,能勝任貴公司爬蟲工程師一職,我的情況大概就是這樣,您看您們這邊還需了解其他什麼嗎?


2.你主要採集的產業領域有哪些?接觸過金融行業嗎?

答:我之前主要接觸過汽車行業,招聘行業,電商行業,金融行業,金融行業也接觸過,但是說實話項目並不是很多,但是技術是相通的,可能剛開始不是很熟悉,只要適應一倆個星期都不是問題。


3.介紹爬蟲用到的技術

答:requests、scrapy:爬蟲框架和分布式爬蟲

xpath:網頁數據提取

re:正則匹配

numpy、pandas:處理數據

matplotlib:繪圖

mysql:數據存儲

redis:爬蟲數據去重和url去重

雲打:處理常規驗證碼

復雜驗證碼:用selenium模擬登陸、處理滑塊驗證碼等(滑塊驗證碼有方法,之前破解過滑塊驗證碼,有空我會出個基本使用教程,進行滑塊驗證碼破解,但不一定通用,因為每個網站反爬措施設置都不一樣)

4.處理過的最難的驗證碼?

答:12306點擊圖片驗證碼。原理:圖片發送給打碼平台,平台返回圖片位置數值,通過計算返回數字和圖片坐標的關系,進行模擬登陸

5.當開發遇到甩鍋問題怎麼解決?

答:如果是小問題自己感覺影響不大,背鍋就背了,畢竟如果是剛入公司很多不懂,可能會犯一些錯誤,如果是大問題,就找責任人(虛心點,不卑不亢)

二面:人事面試 主要問題:

1.你為什麼要從上家公司離職?

答:上家公司離職是因為上家的公司項目基本都已經做完上線了,後面又接的項目感覺挑戰性不大,希望尋找一個平台做更多的項目

2.來之前了解過我們公司嗎?

答:來之前了解過貴公司,現在主要做金融數據採集的任務,後面也會進行一些大數據分析的工作

3.簡單介紹一下你最大的缺點跟優點?

答:我的優點是對工作認真負責,團隊協作能力好,缺點是言辭表達需要提高,還有對一些細節的把握(我最大的缺點就是對細節過分追求,有多少人想這樣說的,能把自己的缺點說成這么好聽的優點,也是666了,這樣說面試成績減10分缺點就老老實實說一點模稜兩可的缺點就好了,不要過於滑頭,也不要太實在)

4.你怎麼理解你應聘的職位,針對你應聘的職位你最擅長的是什麼?

答:這份職位不僅僅是爬蟲方面的技術崗位,更是學習新知識,探索新領域的一條路,希望能有機會給公司貢獻一份力量。最擅長數據採集、處理分析

5.你對加班有什麼看法?除了工資,你希望在公司得到什麼?

答:1,適當的加班可以接受,過度的加班不能,因為要考慮個人,家庭等因素,同時我也會盡量在規定的時間內完成分配給我的任務,當然加班也希望獲得相應的加班費。2,希望這份工作能讓我發揮我的技能專長,這會給我帶來一種滿足感,我還希望我所做的工作能夠對我目前的技能水平形成一個挑戰,從而能促使我提升著急。

6.你的期望薪資是多少?

答:我的期望薪資是13K,因為上家公司已經是10k,而且自己也會的東西比較多,前端、後端、爬蟲都會,跳槽希望有一定的增長。

7.你什麼時候能到崗上班?

答:因為我已經從上家公司離職,可以隨時到崗。(想早上班就別托,先答應越早越好)

8.你還有什麼要問我的嗎?

答:問了公司的福利待遇,上班時間,培養計劃。(上班時間是5天制,沒有培養計劃,項目初創時期)最後結束面試,說這2天會電話通知,因為後面還好幾個競爭對手面試。

結論:面試是個概率事件,同時也跟運氣有關,在我的話術之上多進行面試總結,多面一些公司,相信大家都能找到理想工作

閱讀全文

與大數據工程師筆試題相關的資料

熱點內容
中間夾菜單裡面不能顯示壓縮文件 瀏覽:952
如何指導小學生參加編程比賽 瀏覽:275
物業的招標文件有哪些 瀏覽:452
保存游戲文件名非法或只讀 瀏覽:258
js怎麼做圖片時鍾 瀏覽:451
華為應用裡面有了app說明什麼 瀏覽:801
資料庫中xy是什麼意思 瀏覽:893
u盤打不開提示找不到應用程序 瀏覽:609
網站功能介紹怎麼寫 瀏覽:954
word在試圖打開文件時錯誤 瀏覽:108
主板無vga插槽怎麼連接編程器 瀏覽:521
錄視頻文件在哪裡刪除 瀏覽:881
word2013如何插入文件 瀏覽:233
proe教程百度網盤 瀏覽:197
如何控制遠程linux伺服器 瀏覽:740
it教學app有哪些 瀏覽:34
怎麼在ps摳的圖變成矢量文件 瀏覽:405
口袋妖怪銀魂安卓v11 瀏覽:1
網站上芒果tv的賬號都是什麼 瀏覽:104
帶公式的表格如何刷新數據 瀏覽:81

友情鏈接