2023秋招的第一个意向书

🌻今天和大家分享一下2023的第一个offer,把喜气传给大家,祝愿小伙伴在秋招中offer拿到手软。本篇博客主要和大家分享一下这段时间的学习过程,给大家一些参考。下面是字节的意向书👇:

2023秋招的第一个意向书

; 1. 自我介绍

大家好,我叫柳小葱,来自北京某高校的管理科学与工程专业(人工智能与大数据方向)的学生,爱好就是打球、跑步、敲代码、写博客、… 在滴滴和字节跳动实习过,都是担任着大数据开发(数据研发)实习生的工作,会有少量的分析工作。

2. 为什么选择这个方向?

起初,我其实并不是大数据开发(数据研发)这个方向的,主要是数据挖掘方向,但是在百度、腾讯数据挖掘岗位中败下阵来,在反思的过程中,特别好奇顶级大厂是如何训练模型,最终部署上线的?于是自己去找资料,在这个过程中,便接触到了像hadoop、spark、flink这样的组件。觉得这个方向也挺有意思,而且面试大数据开发(数据研发)的时候也比较顺利,于是就选择了这个方向。

3. 你最初的规划是什么?

去年6月份,我的目标是能进一个大厂,最后去了滴滴,后来发现,大厂中的岗位也是分核心与边缘业务,我的部门算是对企业内部的,不核心也不边缘,数据量也不大,而且数据仓库的主题主要根据业务系统的功能进行划分,所以我一个人负责了几个主题数仓的建设,这算是成长比较大的地方。后面从滴滴离职后,想去阿里巴巴、腾讯、字节这样的顶级大厂,看看这些企业的数仓方法论是什么。

4. 你学习大数据的路线是什么,以及各个层面掌握到什么程度?

我技术路线是如下:

hive -> hadoop -> spark -> flink -> 了解一些ck、es这样的数据库
  1. hive这一个部分,我自己搭建了一个hadoop环境,并在此基础上搭建了hive,主要学习了hive的原理,hive的数据类型,然后是hive的sql语法、hive数据的导入、hive的分桶分区表。
  2. hadoop这个部分,我是自己的搭建的环境,3台虚拟机搭建的分布式环境,主要学习了HDFS的结构、YARN的结构、Hadoop的计算原理,主要是需要着重知道的是shuffle过程。
  3. spark这一个部分,主要是学习了spark的架构,转换算子和行动算子,pyspark的一些语法,spark的并行度、分区数、core数之间的关系,spark数据倾斜的一些知识。
  4. flink这一部分,主要是跟着阿里云的flink社区来学习基础概念,主要包括流式架构、消息队列、flink的原理,通过docker搭建了flink的环境,完成了一个小项目,对flink有了一个基本的了解。
  5. 除此之外,我还参加了数据库系统软考中级、阿里云大数据助理工程师的考试,来增强自己对数据库、大数据的一个认知。

5. 在滴滴的实习过程中,你的收获和成长是什么?

首先,在入职滴滴的时候,其实最开始的时候,我只负责一些逻辑的开发,对表结构如何设计、为何这样命名,为何要分层等很基础的问题都没有个清楚的认知,只对如何开发出复杂的逻辑感兴趣,做的大量的工作都是写代码,渐渐的,我接触到了:

  1. 维度建模
  2. 数据集成
  3. BI看板的搭建
  4. 验证数据

之后,我开始阅读《阿里巴巴的大数据之路》,对数据建模部分进行了阅读,但是对于部分概念,因为没有亲身实践过,所以只懂个大概。

我的收获和成长:

  1. 对企业中大数据的运用架构有了一个大致的了解。
  2. 维度建模的实施、复杂逻辑开发的能力。
  3. 对自己工作方向的一个认知,对数据认真负责的态度。
  4. 激发了自己想去大厂核心业务的决心。

6. 在字节的实习过程中,你的收获和成长是什么?

入职字节,是在今年的4月份,我在1,2,3月份的时候,对理论知识、技术原理进行了复习,才有幸加入字节跳动,在字节这边的业务比在滴滴更复杂一些,也更加贴近大数据分析的完整流程,可能是因为涉及到to C的业务,对用户的行为分析较多,会涉及从埋点到数据集成,数据清洗,数据加工,数据分析的一整套流程,对大数据之路中的一些技巧有了更成熟的理解,有了前一段的实习经验,我开始对比滴滴和字节的数据仓库,思考着目前这个部门的问题:

不足

  1. 埋点数据源管理较差,历史存量埋点和增量埋点不规范
  2. 指标口径末统一
  3. 元数据信息不完整

个人成长

  1. 完成埋点数据分析需求,利用大数据技术还原用户行为,能够用数据指导产品优化用户体验。
  2. 熟悉公司的大数据处理架构,对数据集成、数据计算的原理有更深的了解。
  3. 深入理解维度建模思想,积累复杂逻辑开发经验。
  4. 通过数据bp的需求流程改造,学习了更加标准的需求开发流程。

个人规划

  1. 目前负责的业务方向比较单一,希望能够独立完成某条业务线数仓从0至1的建设。
  2. 尝试解决一些复杂的数据优化的问题,例如优化shuffle机制。
  3. 积极了解大数据方面的新技术,比如数据湖的应用,拓展技术知识面。

7. 对大家的建议

  1. 尽早规划自己的未来,你想干什么,就朝着这个方向坚定不移地奔跑,不要轻易更换方向。
  2. 面试其实也是有技巧的,即使你自己确实知道的很多,但是如何向面试官表达,让对方理解认可你,也是需要进行一些锻炼的。
  3. 很多同学问我是否需要报班来学习数据分析或者大数据开发之类的,我觉得因人而异,可能基础好的同学适合自己学习,基础差的同学需要老师来更好地引导你,根据自己的情况进行选择即可。
  4. 职场上不要着急,不用去在意别人的看法,适当听取别人的建议即可,分清楚pua!

Original: https://blog.csdn.net/weixin_48077303/article/details/126819103
Author: 柳小葱
Title: 2023秋招的第一个意向书

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/817500/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球