异常值检测模型

异常值检测

异常值检测之LOF

异常值检测模型_第1张图片
判断输入值是否为数值型数据,在输入数据类型相同的情况下判断俩点之间的距离
语法点:
一、isinstance(object, classinfo)
参数
object – 实例对象。
classinfo – 可以是直接或间接类名、基本类型或者由它们组成的元组。
返回值
如果对象的类型与参数二的类型(classinfo)相同则返回 True,否则返回 False
二、range 函数
range函数可创建一个整数列表,一般用在 for 循环中。
语法:
range(start,stop, step)
参数:
start: 计数从 start 开始。默认是从 0 开始。例如range(5)等价于range(0,5);
stop: 计数到 stop 结束,但不包括 stop。例如:range(0,5) 是[0,1,2,3,4]没有5
step:步长,默认为1。例如:range(0,5) 等价于 range(0,5,1)
三、enumerate函数
enumerate函数用于将各种迭代器(如列表、元组或字符串)包装为生成器,生成器每次产生一对输出值,前者表示循环下标,后者表示从迭代器中获取到的下一个序列元素。一般用在 for 循环当中。
需要知道当前元素在列表中的索引,推荐用enumerate代替range,代码便于简洁和易理解。
语法:
enumerate(sequence, [start=0])
参数:
sequence: 一个序列、迭代器或其他支持迭代对象。
start:下标起始位置。
四、zip函数
zip函数可以把两个或两个以上的迭代器封装为生成器,以便稍后求值。
生成器会从每个迭代器中获取下一个值,然后把这些值汇聚成元组。
语法:
zip([iterable, …])
参数:
iterabl:一个或多个迭代器

定义LOF类
异常值检测模型_第2张图片
一、map() 函数语法:
map(function, iterable, …)
参数
function – 函数
iterable – 一个或多个序列
返回值
Python 2.x 返回列表。
Python 3.x 返回迭代器。
二、join()函数
语法: ‘sep’.join(seq)
参数说明
sep:分隔符。可以为空
seq:要连接的元素序列、字符串、元组、字典
上面的语法即:以sep作为分隔符,将seq所有的元素合并成一个新的字符串
返回值:返回一个以分隔符sep连接各个元素后生成的字符
异常值检测模型_第3张图片
对样本点每个维度的坐标进行标准正态化

**

计算第k距离

**
k-distance:第k距离
 对于点p的第k距离定义如下:   异常值检测模型_第4张图片

异常值检测模型_第5张图片

异常值检测模型_第6张图片
异常值检测模型_第7张图片

异常值检测模型_第8张图片

*异常值检测模型_第9张图片

你可能感兴趣的:(异常值检测模型)