DAL 今日职位讨论快报 117

#17 2018-10-01

今天分享的职位是一个 Data Scientist 的岗位,来自一个公司 Bigfoot Biomedical。

职位链接:

https://www.linkedin.com/jobs/view/869386360/?eBP=CwEAAAFmMOte3zXz7xs8NYsBkLgJoJ9UI-WNNtXekl29KJU5JKTNQi9PYHtlaVnofD9uDzUs1LcnEuMeiMXvl8HEWscFRd5aQYE5LuaPoRGx8yJLh6PTUUaF4VdMt3FRHkBYRWutFEPWGpU0e5PIMJ9cV2k2S7HLe0eyBnLhq0Wa09Pyr9kUaa0eiD0noilny8EACeWy-0gm0LeRZlc6RTXVVvCJ3XVNVpDzjtsu9428eS_K5oRjNwGGEKZswIjygE-qhPUQknTXtQo9T05vY4OzedCgevW1HWCosZn8opyH4zdTZzBk6fN3inNUgyRJMvnFxBnBBZI--1087aE&refId=4a4bd480-9105-4059-b0e7-07cb08c8e079&trk=d_flagship3_job_home&lipi=urn%3Ali%3Apage%3Ad_flagship3_job_home%3Bn0LppgrySHGHMZG3YwylDQ%3D%3D&licu=urn%3Ali%3Acontrol%3Ad_flagship3_job_home-similartoviewed_view_job

背景介绍:

首先我们来看它是属于哪个领域,我们应该可以判定它是属于 healthcare technology 的领域。我们主要对于healthcare 能做什么?除了能去通过数据分析能帮助用户带来更好的服务,更适合他们的服务以外。我们还要在marketing上做一些事情,我们应该要通过数据分析去避免用户或者说患者的流失,这里就需要你去建模去看看到底是怎么样的模型能去 fit 这个公司所需要的东西。

关于 Churning modeling 的两个数据分析的技术:1. classification,对你的用户来进行分组和分类。你通过去看他的 turning rate 和 survival rate 去看这个具体用户。从不同的角度去看留下来的,和流失走的用户都各自有什么特点,然后我们怎么在此基础上去分析。2. prediction modeling,基于你的数据样本去推算一些东西。比如你的以往的退订的 timing 或者特别的 user behavior 来去预测用户的行为,并且可以给你们的用户一些适时适当的激励来减少他们的退订。

职位介绍:

Quickly bring clarity to business/clinical/product design/engineering challenges.

Work with stakeholders to plan approach, define success.

废话

Use tools such as Matlab to turn data into knowledge which can be used to drive decisions.

如果这个 JD 在反复提到 Matlab 这个事情,希望大家千万不要漏掉这个 skill

Must haves we’re looking for:

5+ years of data science experience.

其实呢,数据科学革命的大潮是从 2014 年开始的,所以就算我们掰指头算,也就五年,所以不要太被这个限制了。

Expert knowledge of analytical techniques:  distribution fitting, multivariate statistics, stochastic modeling, time-series modeling, design of experiments, Monte Carlo methods, robust statistics, sampling, segmentation, clustering, hypothesis testing, regression, forecasting.

这里说的非常非常详细,敲黑板,必须要在你的简历里提到。这里除了需要你明白一些模型,还需要你有design一些test的能力,一定一定都要提前做功课。

Analytical language and framework familiarity:  experience with and ability to assimilate tools like Python, Matlab, R, Hadoop, SAS, JMP, Tableau, d3js.

这里能看出来对于编程能力要求还是挺多的,但我们还是主要put focus on Python R Matlab。

T-shaped:  strong in data science, but also strong capabilities to deliver actionable results in a collaborative startup environment.

这里要求你能够去 deliver 一个可以执行的结果和方案,主要是考量你的执行力。

Excellent pragmatic problem solving, data-driven problem solving approach, extreme attention to detail, strong written and verbal communication skills, curiosity, and a demonstrated ability to learn and grow new skills and experiences.

这一条是偏 behavioral 的东西。

We’d prefer if you also have: 【加分项】

Data visualization skills:  quickly and effectively “tell the data story;” draw from a large portfolio of visualization techniques to bring salient points forward to stakeholders for whom statistics may not be a core competency.

数据可视化对于要面向客户的业务是非常重要的。

Domain expertise: knowledge of diabetes, knowledge of control engineering: feedback control, discrete and continuous time transfer functions, system identification, PID, model predictive control.

这个对于我们大部分的人来说是一个比较难的要求了,很多人都是没有的。那我的建议就是你可以通过一个“偷换概念”或者说通过一个别的东西去体现你有这方面的能力就好了。

Lean/agile experience:  scrum teams, daily standups, time-boxed development, visual management systems, peer collaboration.

这是一个开发的模型,大家可以去了解一下,不需要太多深挖和研究。

Data munging / data wrangling proficiency: demonstrated ability to collect, extract, transform, clean, and combine structured and unstructured data from myriad sources.

这个是很基本的数据分析师,数据科学家都必须有的技能。大家一定要熟悉这个 full cycle。

Educational Requirements:

Master’s degree in a field related to data science: mathematics, statistics, computer science, engineering, physics, machine learning, data mining, actuarial science, econometrics

这是一个比较硬的东西,master degree 肯定是要的,专业其实没有特别多的限制。

Q & A

Q:关于 Chrun Prediction,多说两句?

A:三个步骤 --> 收集数据,在历史数据上去 run model,你要去 load 一个形式为概率的结果。在数据采集数据整理的过程中,你要去做一个 data modeling,feature engineering 啊等等去给用户画像的内容。除了这些静态数据,你还可以分析一些动态的数据,比如他是否没有按时交费?使用健康仪器的 frequency?很多的这些动态数据都会变成你很重要的 indicator。

你可能感兴趣的:(DAL 今日职位讨论快报 117)