数据科学家行为准则 - What Do Data Scientists Do?

  • 定义问题 - Define the question
  • 定义理想的数据集 - Define the ideal data set
  • 确定数据集 - Determine what data you can access
  • 获取数据 - Obtain the data
  • 清洗数据 - Clean the data
  • 探索性数据分析 - Exploratory data analysis
  • 统计预测/建模 - Statistical prediction/modeling
  • 结果解释 - Interpret results
  • 结果输出 - Synthesize/write up results
  • 创建可重复研究的代码 - Create reproducible code
    这一步的重要性在于别人可以依据你的代码复现你的数据结论, 而不是口头说服.
  • 将结果分发给他人 - Distribute results to other people

你可能感兴趣的:(数据科学家行为准则 - What Do Data Scientists Do?)