上代码之前得安装这个分词包,秒级安装镜像pip install jieba -i https://pypi.douban.com/simple/ 好,上代码:
import jieba;
str = "中国是工人阶级领导的以工农联盟为基础的人民民主专政的社会主义国家";
res = " ".join(jieba.cut(str))
print(res)
#coding=utf8
'''创建数据源、返回数据集和类标签'''
def creat_dataset():
datasets = [[8,4,2],[7,1,1],[1,4,4],[3,0,5]]#数据集
labels = ['非常热','非常热','一般热','非常热']#类标签
return datasets,labels
if __name__ == '__main__':
datasets,labels = creat_dataset()
print(datasets,'\n',labels)
上代码:
#coding=utf8
import numpy as np
from numpy import *
import matplotlib
import matplotlib.pyplot as plt
'''创建数据源、返回数据集和类标签'''
def creat_dataset():
datasets = array([[8,4,2],[7,1,1],[1,4,4],[3,0,5]])#数据集
labels = ['非常热','非常热','一般热','非常热']#类标签
return datasets,labels
'''可视化数据分析'''
def analyse_data_plot(x,y):
plt.scatter(x,y)
plt.show()
if __name__ == '__main__':
datasets,labels = creat_dataset()
print('数据集:\n',datasets,'\n','类标签:\n',labels)
'''数据可视化分析'''
analyse_data_plot(datasets[:,0],datasets[:,1])
#coding=utf8
import numpy as np
from numpy import *
import matplotlib
import matplotlib.pyplot as plt
'''创建数据源、返回数据集和类标签'''
def creat_dataset():
datasets = array([[8,4,2],[7,1,1],[1,4,4],[3,0,5]])#数据集
labels = ['非常热','非常热','一般热','非常热']#类标签
return datasets,labels
'''可视化数据分析'''
def analyse_data_plot(x,y):
plt.scatter(x,y)
plt.show()
'''构造KNN分类器'''
#def knn_Classifier(newV,datasets,labels,2):
#1.获取新的样本数据
#2.获取样本库的数据
#3.选择K值
#4.计算样本数据与样本库数据之间的距离
#5.根据距离进行排序
#6.针对K个点,统计各个类别的数量
#7.投票机制,少数服从多数原则
'''欧氏距离计算:d²=(x1-x2)²+(y1-y2)²'''
def ComputerEuclideanDistance(x1,y1,x2,y2):
d = math.sqrt(math.pow((x1-x2),2)+math.pow((y1-y2),2))
return d
'''欧氏距离计算多维度支持'''
def EuclideanDistance(instance1,instance2,length):
d=0
for i in range(length):
d += pow((instance1[i]-instance2[i]),2)
return math.sqrt(d)
if __name__ == '__main__':
#1.创建数据集和类标签
datasets,labels = creat_dataset()
print('数据集:\n',datasets,'\n','类标签:\n',labels)
#2.数据可视化分析
#analyse_data_plot(datasets[:,0],datasets[:,1])
#3.1.欧式距离计算
d = ComputerEuclideanDistance(2,4,8,2)
print(d)
#3.2.欧式距离计算
d2 = EuclideanDistance([2,4],[8,2],2)
print(d2)
#3.3.欧式距离计算,可支持多维
d3 = EuclideanDistance([2,4,9],[8,2,5],3)
print(d3)
#KNN分类器
newV = [2,4,0]
#knn_Classifier(newV,datasets,labels,2)
下一篇笔记分享学习如下内容
本文由博客群发一文多发等运营工具平台 OpenWrite 发布