面经—22应届通过集12和NLP5拿到的年薪40万:NLP需要掌握的技能点

本人双一流应届硕士,在校科研对某一点的知识专研深度,但是在知识的广度上掌握不够,所以希望接触更广泛全面的知识,从而希望系统的学习后可以更好的进行领域的深究,最终参加了七月在线机器学习集训营12,以及NLP5的课程,课程对我的帮助挺大的,也确实如我想的,有了系统的知识后可以更好地深入点的研究,也给我铺垫了不错的基础。

算法岗需要掌握的一些东西:

1、首先传统机器学习与深度学习的基础是需要牢固的

基础知识就包括了领域中的各种模型(原理,公式,推导,应用);

常用的衡量标准以及数学公式(就是有公式的东西都要理解并且能推导,例如blue,F1、各种代价函数以及optimizer等等);

模型、网络之间的比较和各自实际应用场景;

特征工程方面的知识,包括了传统机器学习的一些数据处理方式,深度学习领域的数据处理方式,遇到脏数据怎么办,数据不平衡,OOV怎么处理等等。

2、leetcode是基本的要求

多做题可以提升代码能力,200道差不多(中等难度题即可)。

3、面试掌握的知识点(下面列举的每个点都可以深究):

条件熵、信息熵、信息增益、交叉熵、KL散度、信息增益率之间的联系(理解了能够白纸写出来);

TF-IDF、blue、F1-score、ROC、perplexity;

基本数据与文本数据增强方法;

模型(rnn、gru、lstm、transformer、bert、elmo、HMM、crf、svm、KNN、Kmeans、xgboost、decision_tree等);

batch_norm、layer_norm区别与联系;

weight初始化方式以及为什么这样初始化;

optimizer(SGD、MSGD、AdapGrad、Momentum、RMSprop、Adam);

文本相似度的计算方法;

激活函数、损失函数;

4、最后,项目是重点

比如,需要有实际的应用场景,最好两个以上的解决方案,项目的改进策略

其次项目中数据的分布情况、拿到数据第一时间干了什么(观察其分布情况、观察是否有非正常数据、需要怎么处理)、某个label下的数据太少怎么办(衍生出新的领域在项目可以做,可以参考一些文本增强的论文)。

最后找工作贵在坚持吧,祝愿大家能够找到满意的工作。

Original: https://blog.csdn.net/weixin_48003282/article/details/124480145
Author: 七月在线
Title: 面经—22应届通过集12和NLP5拿到的年薪40万:NLP需要掌握的技能点

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/528652/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球