python糖尿病数据挖掘

有人说21世纪,我们的生活越来越便捷,电子通讯越来越发达,美食越来越多。这一点也不假。但现代生活方式也有不利一面,工作越来越忙,身体锻炼越来越少,体重一天一天增加。有一种疾病叫做糖尿病,你们听说过吗?

餐饮行业为了增加销售量,会增加食物食盐量。这样可以满足顾客重口味。

python糖尿病数据挖掘_第1张图片

饮料厂商为了增加销售量,在饮料里添加不少糖分(碳水化合物)。糖可以刺激大脑,形成正反馈,越喝越想喝,形成对糖依耐性。

python糖尿病数据挖掘_第2张图片

996对程序员并不陌生,一天工作太忙,下班后就葛优躺,拿着手机或看电视。体重一天天增加,我想说的是糖尿病离你还远吗?

python糖尿病数据挖掘_第3张图片

真相是中国糖尿病数据触目惊心!下图显示2019年估算中国糖尿病患病率排名世界第二,我们不是世界第一,是不是很高兴?

python糖尿病数据挖掘_第4张图片

不幸的是,中国人口基数是美国4倍多,因此中国糖尿病患者数量位居世界第一。中国是糖尿病最大药物研发市场。越来越多年轻人也加入糖尿病市场,成为药企摇钱树。

python糖尿病数据挖掘_第5张图片

中国糖尿病患者数量逐年上升,呈现明显上涨态势。近年来糖尿病药物是药企一块大蛋糕。糖尿病相关食品也非常昂贵,很多不懂医学常识的患者付出了巨大代价。

python糖尿病数据挖掘_第6张图片

糖尿病是一种富贵病,患上后无法彻底根治,只能每日用药控制。且糖尿病相关并发症多。每8秒就有1人死于糖尿病及其并发症。如果未经治疗,糖尿病可能引发许多并发症。急性并发症包括糖尿病酮酸血症与高渗透压高血糖非酮酸性昏迷;严重的长程并发症则包括心血管疾病、中风、慢性肾脏病、糖尿病足、以及视网膜病变等。

python糖尿病数据挖掘_第7张图片

医生对于糖尿病患者的建议比较多,少吃含糖高食物,多锻炼,多休息。。。。但哪一条建议特别重要,能否量化分析么?答案是肯定的,你给我数据,我给你答案。

欢迎学习《python机器学习-糖尿病数据挖掘》课程,该课程运用多种回归算法在年龄,性别,体重指数BMI,血压, 和六个血清指标中挖掘哪个因子是最重要致病因子。这些变量有何关联。课程建立模型综合表现显著高于互联网其他课程。

作者介绍

Toby,持牌照金融公司担任模型验证专家,国内最大医药数据中心数据挖掘部门负责人!和重庆儿科医院,中科院教授,赛柏蓝保持慢病数据挖掘项目合作!管理过欧美日中印巴西等国外药典数据库,马丁代尔数据库,FDA溶解度数据库,临床试验数据库,WHO药物预警等数据库。

课程特点

平民价格,非纯商业化价格,让贫困学生也学的起国外最先进流行知识。不需要花费几千上万报天价学习班,自学也可成长。

教程目录

课时1我的所有课程介绍

课时2讲师介绍-二十个医药数据库负责人

课时3糖尿病分类_特征_预防概述

课时4机器学习模型预测糖尿病患者血糖指标

章节2python编程环境搭建

课时5Anaconda快速入门指南

课时6Anaconda下载安装

课时7python第三方包安装(pip和conda install)

章节3糖尿病数据挖掘

课时8建立糖尿病预测线性回归模型(linear regression)

课时9下载糖尿病数据方法(原始数据和清洗后数据)

课时10线性回归和误差

课时11模型验证:均方差和中值绝对误差

课时12多算法比较,模型性能提高2倍

课时13原始数据和处理后数据建模性能对比

课时14糖尿病致病因子量化分析_性别,年龄,血压,BMI指数

课时15变量相关性分析-原来s1和s2血清检测呈现高相关性

课时16长寿之道-这课程是你一生财富

课时17BMI指数python自动化计算脚本

章节4附录

课时18糖尿病中英单词汇总

课时19糖尿病患者更容易感染新冠病毒吗?

课时20最小角度回归预测糖尿病论文LeastAngleRegression

博主用python建立糖尿病血糖指标预测模型,根据用户提供的年龄,性别,血压,BMI等指标,可以预测你是否患有糖尿病。建模数据来自美国真实糖尿病临床数据,总计442条。对于模型来说,442条数据量有些偏少,如果能有1000条以上,就比较nice了。

python糖尿病数据挖掘_第8张图片

研究此项目的美国团队(Bradley Efron, Trevor Hastie, Iain Johnstone and Robert Tibshirani)模型性能一般,MAE约为41.9,r2为0.477。而博主建立模型MAE为13.82,r2为0.9388,远远高于美国团队,模型性能非常优秀,预测数据误差小,更准确。

python糖尿病数据挖掘_第9张图片

博主运用python语言建立糖尿病预测模型部分代码截图,代码量少,效率高快速建模和量化分析致病因子。

python糖尿病数据挖掘_第10张图片

程序对变量相关性分析后,自动把结果保存到excel,方便日后查阅数据,我们发现S1和S2血清指标相关性非常高,模型仅选用s1或s2变量,性能下降不会太大。

python糖尿病数据挖掘_第11张图片

好消息是绝大多数糖尿病属于二类,是可防可控的。我们只要熟悉致病因子,建立良好生活习惯就可以显著降低糖尿病患病概率。此课程对糖尿病致病因子一一分析,并量化排序,是价值含量非常高课程。

python糖尿病数据挖掘_第12张图片

机器学习是一门充满魅力学科,让我们像甘道夫魔法师,可以预知未来。希望我的课程能够帮助到糖尿病患者,相关研发机构,或正在写此题材论文的学生。希望你们分享此课程到朋友圈,让大家重视糖尿病防控,减少政府医药预算开支,让更多人受益。

python糖尿病数据挖掘_第13张图片

关注公众号「python风控模型」,回复关键字:学习资料

你可能感兴趣的:(python生物信息学,数据挖掘,python,人工智能)