数据学科OSEMN原则

数据分析一般会遵循经典的数据科学流水线方法,其名为OSEMN
1.Obtain(获取):解决问题首先要能获取到数据;
2.Scrub(清洗):这包含对缺失数据或无效数据的数据填充和固定列名;
3.Explore(探索):再然后就是探索数据,期待从数据中得到一些启发,找出离群数据和怪异数据,并理解每一个可解释性变量和响应变量之间的关系,为此我们可以用相关数矩陈来搞定,
4.Model(建模):数据建模可以预测员工是否是嫌疑人;
5.INterpret(解读):最后一步是解读数据。随着数据分析,最后会得出什么结论?什么因素导致员工dao pian

你可能感兴趣的:(数据学科OSEMN原则)