📜  Flipkart 数据工程师面试经验 1

📅  最后修改于: 2022-05-13 01:58:27.707000             🧑  作者: Mango

Flipkart 数据工程师面试经验 1

我已经通过Linkedin 申请并接到了HR 的电话。

有4轮面试。

通常,我们将机器编码视为第一轮,由于插槽不可用,我将机器编码作为第二轮。

Round 1(数据建模+SQL查询):我被要求为一家电子商务公司创建数据模型。

  • 需要以优化的方式解释每个表和它们之间的关系。
  • 然后,询问了 3 个 SQL 查询(难度级别-中到难)。

提示:为数据建模做好准备并练习硬 SQL 查询。

第 2 轮(机器编码):我收到了一些 json 文档,并要求我为给定的查询提供解决方案。 (免费使用任何语言/环境)。

  • 我用火花来解决它们。这是我第一次处理json格式,所以在这一轮中我有点挣扎。
  • 小组成员对我的方法和逻辑感到满意。

提示:在这一轮之前熟悉所有文件格式,如果您使用 spark,请使用数据帧。

第 3 轮(技术轮):我已经端到端地解释了我的项目,并对此进行了一些后续问题。

然后,被问及

  • Spark 内部原理和优化技术(深入)
  • 为什么选择无 sql 数据库(优点)
  • 很少有与大数据相关的问题。
  • 2 道基于数组的 DSA 题(类似于缺失数字)(难度级别- 中)
  • 再次根据工作、阶段、任务对 Spark 内部结构提出问题。
  • 给定一个 ETL 场景,并要求解释从摄取到数据仓库的端到端流程。很少有基于相同场景的 SQL 查询。面试官对我的做法很满意。

尖端:

  • 彻底了解 Spark 内部结构、优化技术,因为这一轮具有很高的权重,从而使面试官相信您可以在 Spark 环境中处理工作。
  • 准备 DSA 问题(你永远不知道你可能会遇到困难的问题)

本轮过关,必须面对最后一轮。

第4轮(HM轮):这一轮将测试您的项目理解(端到端)。

  • 你说的每一个答案都有很多后续问题。
  • 准备好面对项目每个部分的问题。

提示:在面对 HM 回合之前,请先问问自己项目的每个部分(如何和为什么)。

判决:选择。