数据经常以原始形式和大量数据提供,因此了解如何查找所需数据并进行分析对于成为成功的数据分析师至关重要
本课程介绍如何使用Haskell来满足您的数据科学需求
教练詹姆斯·丘奇首先解释了描述性统计数据,所以你可以发现范围,平均数,中位数和标准差的重要性
然后,James让你开始使用SQLite3,以便查询数据
接下来,他会带您通过正则表达式和可视化工作
最后,他通过覆盖核密度估计来讨论分配的主题
注意:本课程由Packt Publishing创建
我们很高兴在我们的图书馆举办这一培训
主题包括:
数据范围,平均值和中位数
标准偏差
SQLite3命令行
数据片
常用表达
原子和修饰符
人物类
单个变量的线图
绘制移动平均线
功能缩放
散点图
正态分布
核密度估计(KDE)
可视化
(乐观的音乐)嗨, 我叫詹姆斯教堂, 这是Haskell的数据分析开始。
在本课程中, 我们将从Haskell编程语言的角度学习数据分析。
我们将在瞻博笔记本系统上使用iHaskell环境。
现在一点点关于我自己。
过去几年来, 我一直担任高等教育学教授, 我是几家公司的顾问, 也是美国国家药物滥用研究所的顾问。
最后, 我也是由Packt Publishers学习Haskell数据分析的作者。
在本课程的第一部分中, 我们将介绍CSV文件格式以及描述性统计信息。
我们将要介绍的描述性统计数据将是您最熟悉的统计数据, 平均值和模式以及标准偏差。
在本课程的第二部分中, 我们将介绍SQLite3数据库, 这是一个受欢迎的数据库引擎, 用于处理平面文件。
在本课程的第三部分, 我们将使用正则表达式。
正则表达式是一种允许我们过滤数据的文本模式, 它允许我们确保数据中的列与特定的标准相匹配。
在本课程的第四部分中, 我们将创建令人信服的可视化, 并制作出版物图表和图表。
在本课程的第五部分中, 我们将了解正常分配。
并使用正态分布, 我们将创建一个称为内核密度估计器的可视化。
在本课程的第六部分中, 我们将使用电影镜头数据集开始完成示例, 我们将前五部分组合在一起。
本课程的目标是让您从数学和统计学的初学者中获益, 让您轻松使用大型数据集。
现在, 本课程的先决条件是您了解了一些Haskell编程语言, 您还可以了解一些数学和统计数据。
从那里, 我们可以开始你成为数据分析师的旅程。
那我们走吧。