数据开发 专题汇总

数据开发 面试经验分享列表,共90

| 网上申请
面试过程:

基本情况:双非本非科班,211硕科班
我面试的是暑期实习的数据开发岗位,是在boss上投递的,看了简历之后隔天就约面了,但是因为当时没怎么准备所以一面就挂了,现在看来问的问题都很常规的,分享给大家。

面试官问的面试题:

1.关于我自己的项目拷打,问了有哪些指标,数据源都有哪些,如何构建的
2.数仓分层以及为什么分层
3.spark和Hadoop的区别
4.hive调优了解吗?
然后就是SQL题
1.学生学号id,课程id,成绩score,找出每一个课程中成绩是前三名的学生
2.车辆id,时间戳,每1.3.5.7.秒来一次车,对其分段,分段的条件是这一帧和上一帧相差在10s以内,满足条件的分到一段,然后就可以知道哪一帧数据属于哪一段

赞一下(0) 踩一下

| 校园招聘
面试过程:

小红书的面试感觉难度不低,好多问题其实都不是特别理解在问什么,纯按自己的理解在说,不够总体面试体验还是不错的

面试官问的面试题:

1. 自我介绍之后开始问项目
2.Hadoop 和spark的区别和优劣
3.谈到spark shuffle原理,hashshuffle 和 sortshuffle(这里我描述的不太清楚,说了半天,不知道最后说明白了没)
4.谈谈线程池,阻塞队列有界无界,救急线程
5.JVM内存模型
6.栈溢出的场景和应对方法
7.方法区能不能溢出,如果溢出的话储存的那些类信息怎么办
8.mysql索引设计原则
9算法题:经典两数之和,秒了后 延伸为三数之和
10 反问业务:数据湖技术栈主要为iceberg+flink(这个我确实没想到,以为是hudi)

赞一下(4) 踩一下

| 网上申请
面试过程:

Boss直聘上找的。这辈子第二个面的就是网易云音乐。现在很后悔,错过了这个机会,应该多准备一些的。当时SQL全忘了,就复习了两天就上了。结果出了三道题目都没有答好。然后被面试官教育:数据分析和数据开发的区别。

面试官问的面试题:

三道SQL题
1、select名字里带有 明 的学生。用正则表达式。当时忘记%是匹配一个和多个还是0个和多个了。写了 like '%明' or '%明%'好像
2、成绩大于平均分的学生
3、窗口函数。时间久了有点忘记了。。

赞一下(0) 踩一下

1 2 3 4 5   共 5 页