数据挖掘与建模有效的前提是具备问题领域的专业知识

1.数据挖掘与建模有效的前提是具备问题领域的专业知识

数据挖掘与建模有效的前提是具备问题领域的专业知识。数据挖掘与建模的本质是用一系列数据挖掘算法来创建模型,同时解释模型和业务目标的特点。

2.我们在建模时有时候考虑的是因果关系

我们在建模时有时候考虑的是因果关系,比如研究客户行为特征对他产生购买行为的影响,我们把响应变量设定为客户的购买行为,把特征变量设定为客户的性别、年龄、学历、年收入水平、可支配收入、边际消费倾向等。之所以选取这些特征变量,是基于我们在问题领域的专业知识,或者说是基于我们的经济学理论或者商业运营经验,可以相对比较清晰地知道哪些因素可能会影响消费者的购买行为,所以才能够顺利地建立一个合适的模型。

3.我们在建模的时候有时考虑的是相关关系

我们在建模的时候有时考虑的是相关关系,比如某商业银行发现做完住房按揭贷款的客户在业务办理后半年到一年时间里大概率会有办理小额消费贷款的需求,那么做完住房按揭贷款和办理小额消费贷款需求之间有没有因果关系呢,如果有因果关系又是怎么具体传导的?有的银行客户经理解释为客户做完住房按揭贷款之后通常有装修的需求;有的解释为客户有购买家电家具的需求;有的解释为住房按揭贷款的按月还款会在一定程度上使得消费者原来的收入无法支持现有消费;需要借助银行消费贷款来维持,那么究竟哪种解释、哪种传导机制是真实的、正确的?这时候我们通常很难而且也没有必要去深入分析研究,只需要知道做完住房按揭贷款和办理小额消费贷款需求之间具有强烈的相关关系就可以了。我们可以据此制定有针对性的营销策略,开展相应的客户营销,精准地满足客户需求。在这一过程中,我们依据的就是商业运营经验,通过数据的积累和经营的分析找到了这两者之间的关联关系,从而才可以有针对性地进行建模。

4.数据和实践之间是有差距的,数据只是实践的一部分反映

因此,数据和实践之间是有差距的,数据只是实践的一部分反映,关于实践的更多信息则需要我们通过问题领域的专业知识来弥补,只有将数据和专业知识充分融合,才能够更加全面完整地解释商业历史行为,更加准确有效地预测商业未来表现。

5.实务中,技术人员和业务人员的深度融合与高效沟通是多么重要啊

所以实务中,技术人员和业务人员的深度融合与高效沟通是多么重要啊!我建议:一方面技术人员除了钻研技术以外,也要积极学习所在行业、企业主营业务的相关内容与知识,知道企业的战略是什么,重点发展什么产品,经营效益和风险防控应该注重的关键因素是什么,不断开拓自己的眼界和视野,这样才能成为一名合格的数据分析专家,能够为企业提供有价值的数据分析,而不是单纯的码农甚至“调包工作者”,从而可以提升自己的人力资本。另一方面,业务人员除了关注市场动向、关注客户需求、关注同业竞争之外,还要积极学习掌握一定的数字化技能,不要求像技术人员那样专业,但起码要听懂技术人员的语言,能够撰写出合格的业务需求说明书,能够用一定的专业术语与技术人员进行对话。

6.针对数据分析或机器学习推荐两本入门级的图书

针对数据分析或机器学习推荐两本入门级的图书:《Python机器学习原理与算法实现》(杨维忠 张甜 著 2023年2月新书 清华大学出版社)《Python数据科学应用从入门到精通》(张甜 杨维忠 著 2023年11月新书 清华大学出版社)。这两本书的特色是在数据分析、机器学习各种算法的介绍方面通俗易懂,较少涉及数学推导,对数学基础要求相对不高,在python代码方面讲的很细致,看了以后根据自身需要选取算法、优化代码、科学调参。

《Python机器学习原理与算法实现》(杨维忠 张甜 著 2023年2月新书 清华大学出版社)内容非常详实,包含了Python和机器学习,相当于一次获得了两本书。在讲解各类机器学习算法时,逐一详解用到的各种Python代码,针对每行代码均有恰当注释(这一点基本上是大多数书目做不到的)。《Python机器学习原理与算法实现》一书创作完成后,在正式出版之前,已经开发成一套系统课程,分9次授课,在某全国性股份制商业银行内部开展了培训,490人根据行内组织统一学习,授课完成后放在知鸟平台供回放学习,9次课程累计回放量近3万次,得到参训学员的一致好评,广泛应用于各位学员的工作实践。(所以,这是一本避雷避坑、已经被亲测可行的网红书,只要用心学,都没问题哦)

数据挖掘与建模有效的前提是具备问题领域的专业知识_第1张图片

《Python机器学习原理与算法实现》(杨维忠 张甜 著 2023年2月新书 清华大学出版社)

《Python数据科学应用从入门到精通》一书,旨在教会读者实现全流程的数据分析,并且相对《Python机器学习原理与算法实现》一书增加了很多概念性、科普性的内容,进一步降低了学习难度。国务院发展研究中心创新发展研究部第二研究室主任杨超 ,山东大学经济学院金融系党支部书记、副主任、副教授、硕士生导师张博,山东管理学院信息工程学院院长 袁锋 教授、硕士生导师,山东大学经济学院 刘一鸣 副研究员、硕士生导师,得厚投资合伙人 张伟民等一众大牛联袂推荐。全书内容共分13章。其中第1章为数据科学应用概述,第2章讲解Python的入门基础知识,第3章讲解数据清洗。第4~6章介绍特征工程,包括特征选择、特征处理、特征提取。第7章介绍数据可视化。第8~13章介绍6种数据挖掘与建模方法,分别为线性回归、Logistic回归、决策树、随机森林、神经网络、RFM分析。从数据科学应用和Python的入门,再到数据清洗与特征工程,最终完成数据挖掘与建模或数据可视化,从而可以为读者提供“从拿到数据开始,一直到构建形成最终模型或可视化报告成果”的一站式、全流程指导。买这一本书相当于一下子得到了5本书(Python基础、数据清洗、特征工程、数据可视化、数据挖掘与建模),入门超级简单,不需要编程基础,也不需要过多数学推导,非常适用于零基础学生。

数据挖掘与建模有效的前提是具备问题领域的专业知识_第2张图片

两本书随书赠送的学习资料也很多,包括全部的源代码、PPT、思维导图,还有10小时以上的讲解视频,每一章后面还有练习题及参考答案,还有学习群,相对于只看网络上的视频,一方面更加系统、高效,另一方面照着书一步步操作学起来也事半功倍。全网热销中,当当、京东等平台搜索“Python机器学习 杨维忠”“Python数据科学 杨维忠”即可。

数据挖掘与建模有效的前提是具备问题领域的专业知识_第3张图片

数据挖掘与建模有效的前提是具备问题领域的专业知识_第4张图片

创作不易,恳请大家多多点赞支持,也欢迎大家多多关注我,让我们一起学习Python/SPSS/Stata等相关知识。

你可能感兴趣的:(数据挖掘,人工智能,python,开发语言,机器学习,深度学习,数据分析)