进入顺网内部,感觉工作氛围特别好,期待加入其中;面试过程中一面三人面我,问了些数据分析的常见过程,所做的项目用了什么nlp分析技术,我回答是tf-idf,讲了下原理过程和我在项目过程中是怎么实施的;二面的是一个主管,表情严肃。问的问题也很尖锐,主要是自己在数据仓库这块理解不深,被挂了;问了数据处理量是多少的,回答了是每天4~5百万;然后对方问数据库要处理的量达到1~2亿条,要怎么保证数据能正常运行,具体忘了,大概是要回答是否会使用类似hadoop,hive之类的大数据分析手段;我没有相关方面的经验就挂了
面试官问的面试题: 项目过程是怎样实施的,充当什么角色;tdidf的原理及怎么做分类的;有个场景,数据量有1亿条,你会做哪些处理,怎么提取其中有用的数据;