导航:首页 > 网络数据 > 大数据工程师笔试题

大数据工程师笔试题

发布时间:2023-08-28 21:23:11

① 求恒生电子 软件运维工程师,数据库笔试题!!!

1、写C语言的拷贝函数,要求复制字符串,并且将复制后的字符串逆序
比如form中是1234, 则to中是4321
void strcyp(char * to,const char * form)
不能使用库函数 不能定义其他的变量
最佳答案
int main()
{
char a[10],b[10];
printf("请输入a字符可以随意输入小于10个字符")
/*这里不知道为什么查过10个就前面一部分对
且a字符串就没有值了你可以自己事实*/
scanf("%s",a);
printf("a字符串:%s\n",a);
turnto(a,b);
printf("b字符串:%s\n",b);
printf("a字符串:%s\n",a);
return 0;
}
void turnto(char *q,char *p)
{
int length,i,j;
for(length=0;;length++)
{
if(q[length]=='\0')
break;
}
j=length-1;
for(i=0;i
{
// *(p+i)=*(q+(j--));
p[i]=q[j--];
}
// *(p+i)='\0';
p[i]='\0';
}
第一个编程题:
827328929 数字反转,不能使用类库,不能使用数组。
第二个编程题:
public int[] getNum(aArray[] ,bArray[]){ }
求出数组aArray[] ,和bArray[]两个数组的交集,交集放在数组中返回。
数据库题目:
学生表(student){学好,姓名,年龄,所在系}
课程表(course){课程编号,课程名,学分}
关系表(sc){学号,课程编号,成绩}
1、查询出选修了“数据库”的学生姓名。
2、查询平均成绩大于85分的学生姓名和平均成绩(悲剧的没有写出来)
3、添加一个课程信息(“Java”,’1001‘,2)
4、添加一个唯一索引
5、在学生表中添加身份证列,大小18,非空

② 从数据分析师考试之笔试试题看职业要求

从数据分析师考试之笔试试题看职业要求

一、异常值是指什么?请列举1种识别连续型变量异常值的方法?
异常值(Outlier) 是指样本中的个别值,其数值明显偏离所属样本的其余观测值。在数理统计里一般是指一组观测值中与平均值的偏差超过两倍标准差的测定值。
Grubbs’ test(是以Frank E. Grubbs命名的),又叫maximum normed resial test,是一种用于单变量数据集异常值识别的统计检测,它假定数据集来自正态分布的总体。
未知总体标准差σ,在五种检验法中,优劣次序为:t检验法、格拉布斯检验法、峰度检验法、狄克逊检验法、偏度检验法。
点评:考察的内容是统计学基础功底。
二、什么是聚类分析?聚类算法有哪几种?请选择一种详细描述其计算原理和步骤。
聚类分析(cluster analysis)是一组将研究对象分为相对同质的群组(clusters)的统计分析技术。 聚类分析也叫分类分析(classification analysis)或数值分类(numerical taxonomy)。聚类与分类的不同在于,聚类所要求划分的类是未知的。
聚类分析计算方法主要有: 层次的方法(hierarchical method)、划分方法(partitioning method)、基于密度的方法(density-based method)、基于网格的方法(grid-based method)、基于模型的方法(model-based method)等。其中,前两种算法是利用统计学定义的距离进行度量。
k-means 算法的工作过程说明如下:首先从n个数据对象任意选择 k 个对象作为初始聚类中心;而对于所剩下其它对象,则根据它们与这些聚类中心的相似度(距离),分别将它们分配给与其最相似的(聚类中心所代表的)聚类;然 后再计算每个所获新聚类的聚类中心(该聚类中所有对象的均值);不断重复这一过程直到标准测度函数开始收敛为止。一般都采用均方差作为标准测度函数. k个聚类具有以下特点:各聚类本身尽可能的紧凑,而各聚类之间尽可能的分开。
其流程如下:
(1)从 n个数据对象任意选择 k 个对象作为初始聚类中心;
(2)根据每个聚类对象的均值(中心对象),计算每个对象与这些中心对象的距离;并根据最小距离重新对相应对象进行划分;
(3)重新计算每个(有变化)聚类的均值(中心对象);
(4)循环(2)、(3)直到每个聚类不再发生变化为止(标准测量函数收敛)。
优点:本算法确定的K 个划分到达平方误差最小。当聚类是密集的,且类与类之间区别明显时,效果较好。对于处理大数据集,这个算法是相对可伸缩和高效的,计算的复杂度为 O(NKt),其中N是数据对象的数目,t是迭代的次数。一般来说,K<<N,t<<N 。
缺点:1. K 是事先给定的,但非常难以选定;2. 初始聚类中心的选择对聚类结果有较大的影响。
点评:考察的内容是常用数据分析方法,做数据分析一定要理解数据分析算法、应用场景、使用过程、以及优缺点。
三、根据要求写出SQL
表A结构如下:
Member_ID (用户的ID,字符型)
Log_time (用户访问页面时间,日期型(只有一天的数据))
URL (访问的页面地址,字符型)
要求:提取出每个用户访问的第一个URL(按时间最早),形成一个新表(新表名为B,表结构和表A一致)
create table B as select Member_ID, min(Log_time), URL from A group by Member_ID ;
点评:SQL语句,简单的数据获取能力,包括表查询、关联、汇总、函数等。
另外,这个答案其实是不对的,实现有很多方法,就不贴出来了,大家自己去发挥吧。
四、销售数据分析
以下是一家B2C电子商务网站的一周销售数据,该网站主要用户群是办公室女性,销售额主要集中在5种产品上,如果你是这家公司的分析师,
a) 从数据中,你看到了什么问题?你觉得背后的原因是什么?
b) 如果你的老板要求你提出一个运营改进计划,你会怎么做?
表如下:一组每天某网站的销售数据
a) 从这一周的数据可以看出,周末的销售额明显偏低。这其中的原因,可以从两个角度来看:站在消费者的角度,周末可能不用上班,因而也没有购买该产品的欲望;站在产品的角度来看,该产品不能在周末的时候引起消费者足够的注意力。
b) 针对该问题背后的两方面原因,我的运营改进计划也分两方面:一是,针对消费者周末没有购买欲望的心理,进行引导提醒消费者周末就应该准备好该产品;二是,通过该产品的一些类似于打折促销等活动来提升该产品在周末的人气和购买力。
点评:数据解读能力,获取数据是基本功,仅仅有数据获取能力是不够的,其次是对数据的解读能力。
五、用户调研
某公司针对A、B、C三类客户,提出了一种统一的改进计划,用于提升客户的周消费次数,需要你来制定一个事前试验方案,来支持决策,请你思考下列问题:
a) 试验需要为决策提供什么样的信息?
c) 按照上述目的,请写出你的数据抽样方法、需要采集的数据指标项,以及你选择的统计方法。
a) 试验要能证明该改进计划能显著提升A、B、C三类客户的周消费次数。
b) 根据三类客户的数量,采用分层比例抽样;
需要采集的数据指标项有:客户类别,改进计划前周消费次数,改进计划后周消费次数;
选用统计方法为:分别针对A、B、C三类客户,进行改进前和后的周消费次数的,两独立样本T-检验(two-sample t-test)。
点评:业务理解能力和数据分析思路,这是数据分析的核心竞争力。
综上所述:一个合格的数据分析应该具备统计学基础知识、数据分析方法、数据获取、数据解读和业务理解、数据分析思想几个方面能力。

③ 美国大数据工程师面试攻略有哪些

WEB前端主要包括3方面:HTML css Java。面试也会围绕这些提问。你如果是在国外面试,可能问题会更前沿一些。ITjob官网有WEB前端的知识和相关面试题,很多论坛和贴吧也会做相关的解说。下面贴上部分面试题以供参考。希望能帮到你。
HTML
Doctype作用?严格模式与混杂模式如何区分?它们有何意义?
HTML5 为什么只需要写 <!DOCTYPE HTML>?
行内元素有哪些?块级元素有哪些? 空(void)元素有那些?
页面导入样式时,使用link和@import有什么区别?
常见的浏览器内核有哪些?
html5有哪些新特性、移除了那些元素?如何处理HTML5新标签的浏览器兼容问题?如何区分 HTML 和 HTML5?
简述一下你对HTML语义化的理解?

css

介绍一下标准的CSS的盒子模型?与低版本IE的盒子模型有什么不同的?
CSS选择符有哪些?哪些属性可以继承?
CSS优先级算法如何计算?
如何居中div?如何居中一个浮动元素?如何让绝对定位的div居中?
display有哪些值?说明他们的作用。
position的值relative和absolute定位原点是?
CSS3有哪些新特性?
请解释一下CSS3的Flexbox(弹性盒布局模型),以及适用场景?

JavaScript
介绍JavaScript的基本数据类型。
说说写JavaScript的基本规范?
JavaScript原型,原型链 ? 有什么特点?
JavaScript有几种类型的值?(堆:原始数据类型和 栈:引用数据类型),你能画一下他们的内存图吗?
Javascript作用链域?
谈谈This对象的理解。
eval是做什么的?
什么是window对象? 什么是document对象?
null,undefined的区别?
写一个通用的事件侦听器函数(机试题)。

④ Python面试数据分析,爬虫和深度学习一般都问什么问题,笔试题目考哪些

一面: 技术面试

面试官是一个比较老练的技术总监,貌似80后:

  1. 你先简单做个自我介绍吧。

答:恩,好的,面试官你好,很高兴能来到贵公司面试爬虫工程师一职。我叫XXX,来自于***,毕业于****大学,**学历。(如果专业不是计算机专业,就不要介绍自己的专业,如果是大专以下学历,也不要说自己学历,扬长避短这个道理大家应该都懂得)有2年多爬虫工作经验(如果真实是1年多,就说2年,如果真实是2年多就说3年),工作过2家公司(公司尽量不要说太多,如果2-3年经验说2家就好,以免说的过多让人觉得这人太容易干一段不干,说的太少,可能在一个公司技术积累比较单一),第一家是从实习开始工作的。我就主要介绍下我上家公司的情况吧。我上家公司是****,是一家外包公司(如果是培训班毕业的尽可能说外包,因为在外包公司,任何项目都可能做,方便后面很多问题的解释),我在这家公司做了一年多,这家公司在****。我们这家公司是共有50多人。我在里面负责公司的数据采集爬取,数据处理,绘图分析等(爬虫爬下来的数据很多都会进行一些清洗,可以把自己数据处理,绘图的经验说出来,增加优势,如果没有的话,就业余花时间去学习这方面,常规的方法都不难)。期间主要负责了集团对一些招聘网站、电商网站、金融网站、汽车网站(如果是单一业务的公司,你可能就说不了这么多种类了,一般采集的数据都会比较单一,这就体现了说外包的好处)。我之所以在上家公司离职是因为上家的公司项目基本都已经做完上线了,后面又接的项目感觉挑战性不大,希望寻找一个平台做更多的项目(这个离职原因因人而异,如果换城市的话也可以简单粗暴说我家人、朋友在这边,如果还是同一个城市的话也可以按照我的那样说,也可以其他方式,但是建议不要说公司经营不好之类的,不喜欢这家公司等等,经营不好可能跟公司员工也有关系,如果回答不喜欢上家公司,面试官会接着问,为什么不喜欢,如果我们公司也是这种情况,你会不喜欢吗,面试offer几率就会大大减少)。因为来之前了解过贵公司,现在主要做金融数据采集的任务,后面也会进行一些大数据分析的工作,觉得项目规划很有远见就过来了。(面试前先查下公司底细,知己知彼)因为我在之前公司做过爬虫、分析方面的工作,贵公司的这个项目也刚好是处于初期阶段,我非常喜欢贵公司的这些项目。并且我认为我有能力将贵公司的项目做好,能胜任贵公司爬虫工程师一职,我的情况大概就是这样,您看您们这边还需了解其他什么吗?


2.你主要采集的产业领域有哪些?接触过金融行业吗?

答:我之前主要接触过汽车行业,招聘行业,电商行业,金融行业,金融行业也接触过,但是说实话项目并不是很多,但是技术是相通的,可能刚开始不是很熟悉,只要适应一俩个星期都不是问题。


3.介绍爬虫用到的技术

答:requests、scrapy:爬虫框架和分布式爬虫

xpath:网页数据提取

re:正则匹配

numpy、pandas:处理数据

matplotlib:绘图

mysql:数据存储

redis:爬虫数据去重和url去重

云打:处理常规验证码

复杂验证码:用selenium模拟登陆、处理滑块验证码等(滑块验证码有方法,之前破解过滑块验证码,有空我会出个基本使用教程,进行滑块验证码破解,但不一定通用,因为每个网站反爬措施设置都不一样)

4.处理过的最难的验证码?

答:12306点击图片验证码。原理:图片发送给打码平台,平台返回图片位置数值,通过计算返回数字和图片坐标的关系,进行模拟登陆

5.当开发遇到甩锅问题怎么解决?

答:如果是小问题自己感觉影响不大,背锅就背了,毕竟如果是刚入公司很多不懂,可能会犯一些错误,如果是大问题,就找责任人(虚心点,不卑不亢)

二面:人事面试 主要问题:

1.你为什么要从上家公司离职?

答:上家公司离职是因为上家的公司项目基本都已经做完上线了,后面又接的项目感觉挑战性不大,希望寻找一个平台做更多的项目

2.来之前了解过我们公司吗?

答:来之前了解过贵公司,现在主要做金融数据采集的任务,后面也会进行一些大数据分析的工作

3.简单介绍一下你最大的缺点跟优点?

答:我的优点是对工作认真负责,团队协作能力好,缺点是言辞表达需要提高,还有对一些细节的把握(我最大的缺点就是对细节过分追求,有多少人想这样说的,能把自己的缺点说成这么好听的优点,也是666了,这样说面试成绩减10分缺点就老老实实说一点模棱两可的缺点就好了,不要过于滑头,也不要太实在)

4.你怎么理解你应聘的职位,针对你应聘的职位你最擅长的是什么?

答:这份职位不仅仅是爬虫方面的技术岗位,更是学习新知识,探索新领域的一条路,希望能有机会给公司贡献一份力量。最擅长数据采集、处理分析

5.你对加班有什么看法?除了工资,你希望在公司得到什么?

答:1,适当的加班可以接受,过度的加班不能,因为要考虑个人,家庭等因素,同时我也会尽量在规定的时间内完成分配给我的任务,当然加班也希望获得相应的加班费。2,希望这份工作能让我发挥我的技能专长,这会给我带来一种满足感,我还希望我所做的工作能够对我目前的技能水平形成一个挑战,从而能促使我提升着急。

6.你的期望薪资是多少?

答:我的期望薪资是13K,因为上家公司已经是10k,而且自己也会的东西比较多,前端、后端、爬虫都会,跳槽希望有一定的增长。

7.你什么时候能到岗上班?

答:因为我已经从上家公司离职,可以随时到岗。(想早上班就别托,先答应越早越好)

8.你还有什么要问我的吗?

答:问了公司的福利待遇,上班时间,培养计划。(上班时间是5天制,没有培养计划,项目初创时期)最后结束面试,说这2天会电话通知,因为后面还好几个竞争对手面试。

结论:面试是个概率事件,同时也跟运气有关,在我的话术之上多进行面试总结,多面一些公司,相信大家都能找到理想工作

阅读全文

与大数据工程师笔试题相关的资料

热点内容
imgtool工具中文版 浏览:539
java帮助文件在哪里 浏览:965
win10切换输入语言 浏览:696
haier电视网络用不了怎么办 浏览:361
苹果6手机id怎么更改 浏览:179
米家扫地机器人下载什么app 浏览:82
如何在编程猫代码岛20种树 浏览:915
手机基础信息存储在哪个文件 浏览:726
如何查找手机备份文件 浏览:792
内存清理工具formac 浏览:323
iphone过滤骚扰电话 浏览:981
wap网络如何使用微信 浏览:699
手机迅雷应用盒子在哪个文件夹 浏览:351
windows8网络连接 浏览:442
怎么快速增加qq群人数 浏览:919
锤子视频播放器文件不存在 浏览:707
苹果手机怎么清理app缓存 浏览:682
花园战争2豪华升级包 浏览:517
电脑无法向u盘传输文件 浏览:823
bpn配置文件 浏览:932

友情链接