来自深度之眼课程
截止2019年,互联网算法岗仍是不饱和的,人才供不应求
大厂:
BATJM——ML&CV&NLP
独角兽:
蚂蚁——ML>NLP&CV
头条——NLP>ML>CV
人工智能行业:
商汤——人脸、自动驾驶
旷世——人脸、自动驾驶
小马知行——自动驾驶
经典面试问题
算法题
ML、DL知识
纸上推公式可能发生
相关项目经历
对引导面试主题有重要影响
重要的是:阐述问题的逻辑性和前后的严密性
面试扣分:
简单的算法题
From Leecode
难题部分:
注重思路:
对算法的理解深度:
决定评级
项目经历:
问题分析和解决能力
语言表达技巧
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-nJmptvtQ-1625888374649)(https://i.loli.net/2021/07/09/xXDyUiJNkd3s4mz.png)]
内力:
练习基本的算法题,排序题
至少读一本ML教材,例如李航**《统计学习方法》、《深度学习》,至少读懂一两个算法**
e.g讲一个你最喜欢的算法
认真做一个ML/DL项目,体验从数据清洗、特征工程、模型调优、模型迭代整个建模流程,总结一两个难点、以及你如何应对、解决难点
外力:
机器学习类
搜索推荐
e.g 商品推荐、广告等
路径规划
e.g 美团、物流等
点击率预估
深度学习类
CV
NLP
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-T7Y4Fxrr-1625888374651)(https://i.loli.net/2021/07/09/8SgmkKVnYGEH3jU.png)]
SPRINT1:
业务转化为算法需求
SPRINT2:
数据分析
SPRINT3:
模型迭代
SPRINT4:
部署、总结、评估、维护
机器学习类
深度学习类
数据准备与清洗50%时间
模型训练与调优40%时间
不仅仅是调参,包括调整loss函数等等
其他10%时间
保护:眼睛、颈椎、腰椎、胃
美团饿了么公司的app中对用户发放各种类型的补贴/折扣券,其中有一类仅用于指定商家的折扣券,例如麦当劳满30元减4元优惠券。如何制定发放策略,使其比随机发放的下单转化率更高?假如随机发放500万用户,平均转化率0.1%。
预测用户收到优惠券后的下单概率,按概率从高到低排序,圈定前X%人群发放优惠券。优化指标是预测精度,目标是>0.1%。
第一步获取数据、简单分析,了解业务数据大致分布
第二步做特征工程:
经过数据分析,我们发现用户交易行为、登陆习惯、优惠券金额等数据影响用户下单概率,特征方向主要考虑
第三步,跑模型
通常使用GBDT,调整参数做实验。数据量大约1000万至1亿行样本,特征量大约数十个至数百个。模型跑完分析结果,可能出现的情况有
模型精度比业务情况高十倍,1%,可能某个特征处理时出现问题造成数据泄漏了,比如每一笔交易的优惠券使用额隐含了这笔交易(Label=1)
模型精度比较符合业务情况,稍高于0.1%,分析模型预测结果,迭代
模型精度非常低,某类特征过拟合,比如样本中某个城市进行了大力度促销,需要谨慎处理地理位置这个特征
某炼钢厂流水线上安装摄像探头采集图片,希望通过目标检测判断钢铁生产过程中可能发生的坏点,做到自动化质量控制。钢厂仅提供10张样本图片
转化成算法问题
目标检测:
第一步,分析
分析10张样本,发现可以通过网上某个类似的公开图片集先做实验,下载图片集。如果没有标记,需要自己动手标记或找同事一起标记。
第二步,完成数据存储和数据清洗等
第三步,建模
互联网算法类工作晋升路线分为管理类/技术类
本科一般P4-P5起步,硕士P5,工作1-3年P6,5年能力强的P7
如果你在具备算法开发能力之外,同时具备优秀的沟通能力、或者敏锐的商业嗅觉,不要埋没了你的能力,导找适合自己的职业路线。
如果你在具备算法开发能力之外,同时具备优秀的沟通能力、或者敏锐的商业嗅觉,不要埋没了你的能力,导找适合自己的职业路线。