【第八周:08/12-08/16】CNC和MaxMind城市名FSN乱码匹配

一.2019/08/12

01.聚类思路:通过文本聚类算法,借助maxmind的经纬度对其city_name进行聚类分析,得到上级城市名:https://blog.csdn.net/Changyuyang/article/details/81631521

https://blog.csdn.net/sunshine_duoy/article/details/53044365

二.2019/08/13

01.SettingwithCopyWarning解决:https://www.jianshu.com/p/72274ccb647a

02.pandas sort_values用法:https://blog.csdn.net/wendaomudong_l2d4/article/details/80648633

fsn.sort_values(axis=0,by="FSN",kind='quicksort',inplace=True)#排序

03.在线编辑Markdown的编辑器:http://mahua.jser.me/

04.可视化Markdown编辑器(冷熊):http://cv.ftqq.com/#

三.2019/08/14

01.超大csv文件快速加载软件:https://blog.csdn.net/feiren127/article/details/81876065

02.解决IPy模块中IP段转换时出现ValueError: ("IP('1.40.3.0/19') has invalid prefix length (19)报错:

IPY.IP('127.0.0.1/24',make_net=1)
主要是make_net默认为0,就是标准的iP最后一位是16,32,这种才行,设置为1,就可以自己定义了。

https://zhidao.baidu.com/question/918698143971378899.html

03.Python @property装饰器作用:https://www.cnblogs.com/coder2012/p/4433703.html

04.使用html在github上搭建个人静态主页:https://blog.csdn.net/hohaizx/article/details/85066248

05.使用github+jekyll搭建高级个人网站:https://www.jianshu.com/p/9f71e260925d

06.jekyll主题官网:http://jekyllthemes.org/

四.2019/08/15

01.pycharm安装并配置autopep8模块,使代码自动调整为pep8风格:https://www.cnblogs.com/xiao-apple36/p/9242069.html

02.python PEB8编码规范:https://blog.csdn.net/ratsniper/article/details/78954852

03.python私有变量和私有方法的命名规范:https://www.cnblogs.com/lijunjiang2015/p/7802410.html

1、 _xx 以单下划线开头的表示的是protected类型的变量。即保护类型只能允许其本身与子类进行访问。若内部变量标示,如: 当使用“from M import”时,不会将以一个下划线开头的对象引入 。

2、 __xx 双下划线的表示的是私有类型的变量。只能允许这个类本身进行访问了,连子类也不可以用于命名一个类属性(类变量),调用时名字被改变(在类FooBar内部,__boo变成_FooBar__boo,如self._FooBar__boo)

3、 __xx__定义的是特列方法。用户控制的命名空间内的变量或是属性,如init , __import__或是file 。只有当文档有说明时使用,不要自己定义这类变量。 (就是说这些是python内部定义的变量名)

04. 用Python实现不同数据源的对象匹配实验记录:https://segmentfault.com/a/1190000006931575

现有两份针对同一主题的数据,但是在人物的属性名称及格式上有所不同,需要对两份数据进行匹配来确定是同一个人。

(遇到的问题都比较经典!可以借鉴)

五.2019/08/16

01.神器!:unihandecode,可直接将拉丁文、希腊文、俄文等不规范字母、字符串转换为标准英文字母:

https://stackoverflow.com/questions/1382998/latin-1-to-ascii

https://segmentfault.com/a/1190000006931575

import unihandecode
ch['FSN_std']=ch['FSN'].apply(lambda x: unihandecode.unidecode(x))

02.ACM程序设计文档说明:

【第八周:08/12-08/16】CNC和MaxMind城市名FSN乱码匹配_第1张图片

03.pandas中字符串的替换与全部替换:https://www.jianshu.com/p/2557a805211f

for i in "()/'`!- _":
    fsn_latin['FSN_std']=fsn_latin['FSN_std'].str.replace(i, '')

 

你可能感兴趣的:(实习笔记:WS)