数字化转型必然面对的问题
说起来数字化转型已经被提倡了至少3年时间,从我的实际体会上存在以下困难:
从某种程度上说,建模所需的数据恰恰是隐私无关
的。类似电话号码、身份证这样的数据,对模型一点用都没有。模型需要的是学习并提取通用的规律。
刚才还想着怎么解释,正好有一个Kaggle的竞赛有点兴趣,难道这不是一种很理想的方式吗?(企业出钱,整理好数据,让大家来做,选择做的好的)
10万美金,对一个企业来说,多吗?
将数据维度和实际业务意义进行剥离
这一步比较简单,例如age
变量可以比较容易猜出业务