Python_P叔

两个好用到爆的 Python 模块，建议收藏！

来源丨网络

在日常开发工作中，经常会遇到这样的一个问题：要对数据中的某个字段进行匹配，但这个字段有可能会有微小的差异。比如同样是招聘岗位的数据，里面省份一栏有的写“广西”，有的写“广西壮族自治区”，甚至还有写“广西省”……为此不得不增加许多代码来处理这些情况。

今天跟大家分享FuzzyWuzzy一个简单易用的模糊字符串匹配工具包。让你轻松解决烦恼的匹配问题！

前言

在处理数据的过程中，难免会遇到下面类似的场景，自己手里头获得的是简化版的数据字段，但是要比对的或者要合并的却是完整版的数据（有时候也会反过来）

最常见的一个例子就是：在进行地理可视化中，自己收集的数据只保留的缩写，比如北京，广西，新疆，西藏等，但是待匹配的字段数据却是北京市，广西壮族自治区，新疆维吾尔自治区，西藏自治区等，如下。因此就需要有没有一种方式可以很快速便捷的直接进行对应字段的匹配并将结果单独生成一列，就可以用到FuzzyWuzzy库。

FuzzyWuzzy库介绍

FuzzyWuzzy 是一个简单易用的模糊字符串匹配工具包。它依据 Levenshtein Distance 算法，计算两个序列之间的差异。

Levenshtein Distance 算法，又叫 Edit Distance 算法，是指两个字符串之间，由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符，插入一个字符，删除一个字符。一般来说，编辑距离越小，两个串的相似度越大。

这里使用的是Anaconda下的jupyter notebook编程环境，因此在Anaconda的命令行中输入一下指令进行第三方库安装。

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple FuzzyWuzzy**1 fuzz模块**

1、fuzz模块

该模块下主要介绍四个函数（方法），分别为：简单匹配（Ratio）、非完全匹配（Partial Ratio）、忽略顺序匹配（Token Sort Ratio）和去重子集匹配（Token Set Ratio）

注意：如果直接导入这个模块的话，系统会提示warning，当然这不代表报错，程序依旧可以运行（使用的默认算法，执行速度较慢），可以按照系统的提示安装python-Levenshtein库进行辅助，这有利于提高计算的速度。

1.1 简单匹配（Ratio）

简单的了解一下就行，这个不怎么精确，也不常用

fuzz.ratio("河南省", "河南省")

output

100  
fuzz.ratio("河南", "河南省")

output

1.2 非完全匹配（Partial Ratio）

尽量使用非完全匹配，精度较高

fuzz.partial_ratio("河南省", "河南省")

output

100  
fuzz.partial_ratio("河南", "河南省")

output

1.3 忽略顺序匹配（Token Sort Ratio）

原理在于：以空格为分隔符，小写化所有字母，无视空格外的其它标点符号

fuzz.ratio("西藏 自治区", "自治区 西藏")

output

50  
fuzz.ratio('I love YOU','YOU LOVE I')

output

30  
fuzz.token_sort_ratio("西藏 自治区", "自治区 西藏")

output

100  
fuzz.token_sort_ratio('I love YOU','YOU LOVE I')

output

1.4 去重子集匹配（Token Set Ratio）

相当于比对之前有一个集合去重的过程，注意最后两个，可理解为该方法是在token_sort_ratio方法的基础上添加了集合去重的功能，下面三个匹配的都是倒序

fuzz.ratio("西藏 西藏 自治区", "自治区 西藏")

output

40  
fuzz.token_sort_ratio("西藏 西藏 自治区", "自治区 西藏")

output

80  
fuzz.token_set_ratio("西藏 西藏 自治区", "自治区 西藏")

output

fuzz这几个ratio()函数（方法）最后得到的结果都是数字，如果需要获得匹配度最高的字符串结果，还需要依旧自己的数据类型选择不同的函数，然后再进行结果提取，如果但看文本数据的匹配程度使用这种方式是可以量化的，但是对于我们要提取匹配的结果来说就不是很方便了，因此就有了process模块。

process模块

用于处理备选答案有限的情况，返回模糊匹配的字符串和相似度。

2.1 extract提取多条数据

类似于爬虫中select，返回的是列表，其中会包含很多匹配的数据

choices = ["河南省", "郑州市", "湖北省", "武汉市"]  
process.extract("郑州", choices, limit=2)

output

[('郑州市', 90), ('河南省', 0)]

extract之后的数据类型是列表，即使limit=1，最后还是列表，注意和下面extractOne的区别

2.2 extractOne提取一条数据

如果要提取匹配度最大的结果，可以使用extractOne，注意这里返回的是元组类型，还有就是匹配度最大的结果不一定是我们想要的数据，可以通过下面的示例和两个实战应用体会一下

process.extractOne("郑州", choices)

output

('郑州市', 90)  
process.extractOne("北京", choices)

output

('湖北省', 45)

3. 实战应用

这里举两个实战应用的小例子，第一个是公司名称字段的模糊匹配，第二个是省市字段的模糊匹配

3.1 公司名称字段模糊匹配

数据及待匹配的数据样式如下：自己获取到的数据字段的名称很简洁，并不是公司的全称，因此需要进行两个字段的合并

直接将代码封装为函数，主要是为了方便日后的调用，这里参数设置的比较详细，执行结果如下：

3.1.1 参数讲解

第一个参数df_1是自己获取的欲合并的左侧数据（这里是data变量）；
第二个参数df_2是待匹配的欲合并的右侧数据（这里是company变量）；
第三个参数key1是df_1中要处理的字段名称（这里是data变量里的‘公司名称’字段）
第四个参数key2是df_2中要匹配的字段名称（这里是company变量里的‘公司名称’字段）
第五个参数threshold是设定提取结果匹配度的标准。注意这里就是对extractOne方法的完善，提取到的最大匹配度的结果并不一定是我们需要的，所以需要设定一个阈值来评判，这个值就为90，只有是大于等于90，这个匹配结果我们才可以接受
第六个参数，默认参数就是只返回两个匹配成功的结果
返回值：为df_1添加‘matches’字段后的新的DataFrame数据

3.1.2 核心代码讲解

第一部分代码如下，可以参考上面讲解process.extract方法，这里就是直接使用，所以返回的结果m就是列表中嵌套元祖的数据格式，样式为: [(‘郑州市’, 90), (‘河南省’, 0)]，因此第一次写入到’matches’字段中的数据也就是这种格式

注意，注意：元祖中的第一个是匹配成功的字符串，第二个就是设置的threshold参数比对的数字对象

s = df_2[key2].tolist()  
m = df_1[key1].apply(lambda x: process.extract(x, s, limit=limit))      
df_1['matches'] = m

第二部分的核心代码如下，有了上面的梳理，明确了‘matches’字段中的数据类型，然后就是进行数据的提取了，需要处理的部分有两点需要注意的：

提取匹配成功的字符串，并对阈值小于90的数据填充空值
最后把数据添加到‘matches’字段

m2 = df_1['matches'].apply(lambda x: [i[0] for i in x if i[1] >= threshold][0] if len([i[0] for i in x if i[1] >= threshold]) > 0 else '')  
# 要理解第一个‘matches’字段返回的数据类型是什么样子的，就不难理解这行代码了  
# 参考一下这个格式：[('郑州市', 90), ('河南省', 0)]  
df_1['matches'] = m2  
return df_1

3.2 省份字段模糊匹配

自己的数据和待匹配的数据背景介绍中已经有图片显示了，上面也已经封装了模糊匹配的函数，这里直接调用上面的函数，输入相应的参数即可，代码以及执行结果如下：

数据处理完成，经过封装后的函数可以直接放在自己自定义的模块名文件下面，以后可以方便直接导入函数名即可，可以参考将自定义常用的一些函数封装成可以直接调用的模块方法。

4. 全部函数代码

#模糊匹配  
  
def fuzzy_merge(df_1, df_2, key1, key2, threshold=90, limit=2):  
    """  
    :param df_1: the left table to join  
    :param df_2: the right table to join  
    :param key1: key column of the left table  
    :param key2: key column of the right table  
    :param threshold: how close the matches should be to return a match, based on Levenshtein distance  
    :param limit: the amount of matches that will get returned, these are sorted high to low  
    :return: dataframe with boths keys and matches  
    """  
    s = df_2[key2].tolist()  
  
    m = df_1[key1].apply(lambda x: process.extract(x, s, limit=limit))      
    df_1['matches'] = m  
  
    m2 = df_1['matches'].apply(lambda x: [i[0] for i in x if i[1] >= threshold][0] if len([i[0] for i in x if i[1] >= threshold]) > 0 else '')  
    df_1['matches'] = m2  
  
    return df_1  
  
from fuzzywuzzy import fuzz  
from fuzzywuzzy import process  
  
df = fuzzy_merge(data, company, '公司名称', '公司名称', threshold=90)  
df

---------------------------END---------------------------

题外话

感兴趣的小伙伴，赠送全套Python学习资料，包含面试题、简历资料等具体看下方。

CSDN大礼包：全网最全《Python学习资料》免费赠送！（安全链接，放心点击）

一、Python所有方向的学习路线

Python所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照下面的知识点去找对应的学习资源，保证自己学得较为全面。

二、Python必备开发工具

工具都帮大家整理好了，安装就可直接上手！

三、最新Python学习笔记

当我学到一定基础，有自己的理解能力的时候，会去阅读一些前辈整理的书籍或者手写的笔记资料，这些笔记详细记载了他们对一些技术点的理解，这些理解是比较独到，可以学到不一样的思路。

四、Python视频合集

观看全面零基础学习视频，看视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。

五、实战案例

纸上得来终觉浅，要学会跟着视频一起敲，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。

六、面试宝典

简历模板

CSDN大礼包：全网最全《Python学习资料》免费赠送！（安全链接，放心点击）

若有侵权，请联系删除

你可能感兴趣的:(python,开发语言)

Flutter开发之Dart语言 caiyajie666 Flutter flutter 开发语言
Dart是Flutter框架的官方开发语言，Flutter应用几乎完全使用Dart编写。Flutter的跨平台特性使得Dart在移动应用开发中非常受欢迎。Dart是面向对象的、类定义的、单继承的语言，支持面向对象编程，包括封装、继承和多态等特性；Dart支持接口(interfaces)、混入(mixins)、抽象类(abstractclasses)、具体化泛型、可选类型。Dart中很多概念跟其他语
Python爬虫 -- re正则+csv存储小鞠.. Python爬虫 python 爬虫开发语言
爬取Boss上有关Python的工作。网址链接https://www.zhipin.com/wapi/zpgeek/search/joblist.json?scene=1&query=python&city=100010000&experience=&payType=&partTime=°ree=&industry=&scale=&stage=&position=&jobType=&sala
Python常用国内镜像源（清华、豆瓣、阿里云、中科大）老马达 #深度学习基础 python
使用Python最便捷的就是下载使用各种“包”，然而往往长时间不用就容易忘记，在这里将网上一些资源收集整理，一是方便自己日后使用，二是与诸君共享。一、代码清华大学开源软件镜像站：https://pypi.tuna.tsinghua.edu.cn/simple阿里云开源镜像站：https://mirrors.aliyun.com/pypi/simple/豆瓣：https://pypi.douban.
python实现数据库存储过程_Python通过调用mysql存储过程实现更新数据功能示例食色也 python实现数据库存储过程
本文实例讲述了Python通过调用mysql存储过程实现更新数据功能。分享给大家供大家参考，具体如下：一、需求分析由于管理费率配置错误，生成订单的还本付息表和订单表的各种金额，管理费之间的计算都有错误，需要进行数据订正。为此，为了造个轮子，以后省很多功夫，全部用程序去修正，不接入人工。二、带参数mysql存储过程创建1、更新订单付息表(t_order_rapay)dropprocedureifex
python调用数据库存储过程_python连接mysql调用存储过程示例 weixin_39806948 python调用数据库存储过程
复制代码代码如下:#!/usr/bin/envpython#-*-coding:utf8-*-importMySQLdbimporttimeimportos,sys,stringdefCallProc(id,onlinetime):'''调用存储过程，输入参数：编号，在线时间，输出：帐号，密码;使用输出参数方式'''accname=''accpwd=''conn=MySQLdb.connect(h
python调用MySql存储过程 weixin_30667649 数据库 python
环境：1.mysql5.0或者以上支持存储过程的版本2.安装MySQL-python，目前支持到2.x步骤：一.数据库准备1.建立表CREATETABLE`Account`(`id`BIGINT(20)NOTNULLAUTO_INCREMENT,`sm_accountName`VARCHAR(100)COLLATEgbk_chinese_ciNOTNULLDEFAULT'',`sm_passwor
PyTorch从入门到精通：探索深度学习新境界 lmtealily 深度学习 pytorch 人工智能
引言PyTorch作为当前最受欢迎的深度学习框架之一，凭借其动态计算图的独特设计和与Python生态的无缝集成，正重塑着人工智能开发的新范式1。从NVIDIA的研究实践到Meta的产业应用，PyTorch的价值已渗透至学术研究、工业部署的每个角落。本文将带领您从张量操作基础开始，逐步探索GPU加速、动态图机制、框架生态集成等高级主题，最终实现理论与实战的双重突破。一、PyTorch核心基础构建1.
Python调用mysql存储过程 Up_梅子酒 mysql python
Python调用mysql存储过程importpymysqlconn=pymysql.connect(host='127.0.0.1',port=3306,user='root',password='root',database='test',charset='utf8')cur=conn.cursor()cur.callproc('T1')#调用存储过程conn.commit()result=c
Python存储数据库教程--超详细！！小鞠.. 数据库 Python爬虫 python 数据库 mysql
目录1、首先导入需要用到的包2、连接数据库3、创建游标对象4、创建名为`dataname`的数据库，如果数据库不存在则创建，字符集设置为`utf8`。5、执行sql1语句6、创建数据表语句1.如果名为`user_id`的数据表不存在，则创建一个名为`user_tb`的数据表2.列定义7、执行sql2语句8、设置需要存入数据库的字段9、将数据插入`user_tb`数据表10、执行sql3语句11、提
anaconda运行python3_Anaconda上的python3初体验 weixin_39534208
正好最近没事，打算学习一下python3还有学学怎么看英语文献。然后接触到了Anaconda，当然之前也有用过python3的ide还有pycharm，不过实话实说Anaconda目前都非常让我满意。毕竟学计算机，人生苦短，没必要为了繁琐的软件使用来浪费时间。Anaconda就很好的解决了这个问题，他上面把许多有用的东西整合到了一起，非常方便快捷。安装Anaconda也没有太大难度，选择好对应环境
Anaconda-用conda创建python虚拟环境 g_grace1 深度学习
原文链接https://zhuanlan.zhihu.com/p/94744929conda可以理解为一个工具，也是一个可执行命令，其核心功能是包管理和环境管理。包管理与pip的使用方法类似，环境管理则是允许用户方便滴安装不同版本的python环境并在不同环境之间快速地切换。conda的设计理念conda将几乎所有的工具、第三方包都当作package进行管理，甚至包括python和conda自身。
在anaconda中创建python环境咕噜oo Python python anaconda
查看所有python虚拟环境condaenvlist星号表示默认环境。创建环境condacreate-npython37python=3.7.0其中python37是环境名称，自定义；python=3.7.0是python版本号。创建成功后可以发现在[anaconda3本地路径]\envs（D:\big_data\Anaconda3\envs）文件夹下会出现python37文件夹：也可以手动指定路
RSA加密算法详解：从基础原理到实际应用冬停算法
RSA加密算法详解：从基础原理到实际应用在现代信息安全领域，RSA加密算法因其坚实的数学基础和广泛的应用而备受关注。本文将全面介绍RSA算法的原理、密钥生成、加密解密过程以及数字签名的实现，并通过Python示例代码帮助您深入理解和掌握RSA的实际应用。目录什么是RSA？RSA的基本原理RSA密钥生成RSA加密与解密RSA签名与验证RSA的安全性Python实现RSA7.1RSA密钥生成示例7.2
Anaconda与python版本依旧天真无邪 Python Anaconda python anaconda
下面的地址可以查看anaconda对应的python版本:https://docs.anaconda.com/anaconda/packages/oldpkglists/下面的地址安装python3.7.X的最新版本：https://www.python.org/downloads/release/python-379/下面的地址安装anaconda的各版本：https://mirrors.tun
浅谈Python项目开发&管理、烟雨楼 python linux 开发语言
本文主要探讨的是个人在Python项目开发&管理这块的一些经验之谈，经过在团队实践后主要内容总结如下：基础环境管理编码标准&规范化远程开发项目脚手架环境管理使用Anaconda和Pipenv共同管理Python项目环境环境管理这块是个很普遍的问题，其面临的问题如下：如何对不同项目，任意Python版本的环境进行管控如何对不同项目，内外网Python依赖库进行管控（有些包是公司内部开发，那么对于项目
【Python】已解决：pip安装第三方模块（库）与PyCharm中不同步的问题（PyCharm添加本地python解释器）屿小夏 python pip pycharm
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
Anaconda安装与Python虚拟环境配置保姆级图文教程(附速查字典)_anaconda配置python环境全栈工程师_oEe python 开发语言
2什么是Anaconda？Anaconda是一个开源的跨平台Python发行版本，支持WindowsmacOSLinux操作系统。Anaconda中包含了conda等180多个科学包及其依赖项。其中conda则是一个开源的软件包管理系统和环境管理系统，用于安装多个版本的软件包及其依赖关系，并在它们之间轻松切换。3Anaconda的安装进入Anaconda下载界面选择相应的操作系统，本文主要介绍在W
【Python】Python 环境搭建白冥_曜家的 Python学习路线 python python
目录安装pythonpip3与venv[^5]VSCode[^9]安装python目前，Python有两个版本，一个是2.x版，一个是3.x版，这两个版本是不兼容的。推荐安装Python3.x，建议从Python的官方网站下载安装程序1，推荐下载最新版本2的Windowsinstaller(64-bit)3。运行下载的安装包，记得勾上AddPython3.xtoPath4，然后点InstallNo
2.5 python接口编程 nervermore990 Python python
在现代软件开发的复杂生态系统中，不同系统、模块之间的交互协作至关重要。接口编程作为一种关键机制，定义了组件之间的通信规范与交互方式。Python凭借其卓越的灵活性、丰富的库资源以及简洁易读的语法，在接口编程领域占据了重要地位，广泛应用于各类项目开发中，从Web应用到数据处理，再到自动化测试等场景。一、接口编程基础概念（一）接口的定义从本质上讲，接口是一种抽象的规范，它规定了一组方法或行为的签名，但
《Python 环境配置指南：pip 安装与常用命令大全（附代码示例）》细水长流者环境 python pip chrome
《Python环境配置指南：pip安装与常用命令大全（附代码示例）》目录1.前言2.什么是pip？3.检查pip是否安装4.安装pip5.常用pip命令1)安装包2)升级包3)卸载包4)查看已安装的包5)导出与安装依赖6.配置国内镜像源7.虚拟环境管理8.总结9.参考文档1.前言在Python开发中，pip是管理第三方库的必备工具。无论是安装、升级还是卸载包，pip都能轻松搞定。本文将详细介绍pi
Python Camera Get Data 2 Robot 资深设备全生命周期管理 python 网络数据库
importtkinterastkfromtkinter.scrolledtextimportScrolledTextimportsocketimportjsonimportdatetime#全局变量用于模拟模式和连接状态SIMULATION_MODE=TruePROGRAM_STARTED=Falseepson_socket=Noneconfig={}commands=[]#模拟读取文件数据的函
使用Python实现无人机路径规划的灰狼优化算法闲人编程 python python 无人机算法灰狼优化路径规划
目录使用Python实现无人机路径规划的灰狼优化算法引言1.灰狼优化算法概述1.1定义1.2算法原理1.3灰狼的狩猎策略1.4算法步骤2.Python中的灰狼优化算法实现2.1安装必要的库2.2定义类2.2.1灰狼类2.2.2群体类2.2.3路径规划类2.3示例程序3.灰狼优化算法的优缺点3.1优点3.2缺点4.改进方向5.应用场景结论使用Python实现无人机路径规划的灰狼优化算法引言无人机的路
如何测试模型的推理速度想要躺平的一枚 AI图像算法计算机视觉
前言模型的推理速度测试有两种方式：一种是使用python的时间戳time函数来记录，另一种是使用Pytorch里的Event。同时，在进行GPU测试时，为减少冷启动的状态影响，可以先进行预热。代码如下（示例）：if__name__=="__main__":model=BiSeNet(backbone='STDCNet813',n_classes=2,export=True)model.cuda()
Python tkinter设置背景颜色乙龙 python 开发语言
在Python的tkinter库中，设置组件的背景颜色通常使用bg选项，通过config方法来实现。以下是一些设置背景颜色的基本示例：设置单个组件的背景颜色：widget.config(bg='color')其中widget是tkinter组件的实例，color可以是颜色名称（如'red','blue'等）或者十六进制颜色代码（如'#FF5733'）。创建窗口并设置背景颜色：importtkint
新建PyCharm以及文件和代码模板老虎也淘气 Python编程掌握指南 pycharm python ide
本文主要帮助新人新建PyCharm文件初步了解和代码模板的建立。在这里，我将为您提供在PyCharm中创建项目、文件和代码模板的简单步骤。请注意，PyCharm版本可能会在时间推移中有所更改，因此这里提供的指导是基于2021年9月的知识。如果您使用的是更高版本，界面可能略有不同，但大致概念是相似的。前言：在当今的软件开发领域中，高效而智能的开发工具是每位开发者追求的目标之一。对于Python开发者
TCP的通信过程姬浩然 python tcp通信过程的实现 python
3.TCP通信过程3.1编码解码ipython3工具安装pip3installipython3s="hellodage"#str类型不能直接在网络中传输如果需要传输需要转换为Bytes二进制字节类型#utf-8编码情况一个汉字3个字节；GBK编码情况下一个汉字2字节s1="hello大哥"#str-编码->bytes二进制数据=字符串数据.encode(encoding='utf-8')In[8]
麒麟系统利用pycharm生成deb文件乙龙 kylin
在麒麟系统（KylinOS）上使用PyCharm进行Python开发并生成.deb可安装软件包，可以按照以下步骤进行操作：1.准备工作安装PyCharm：确保已经在麒麟系统上安装了PyCharm，可以使用官方提供的安装包进行安装。安装必要的工具和依赖：确保系统中安装了dpkg、debhelper等工具，这些工具用于创建和管理.deb包。sudoapt-getinstalldpkgdebhelper
【使用DeepSeek辅助Python接口性能自动化测试教程-实战教程】生活De°咸鱼 AIGC python 开发语言 AI编程
使用DeepSeek辅助Python接口性能自动化测试教程一、准备工作（一）安装Python（二）安装相关库（三）获取DeepSeekAPIKey二、调用DeepSeek生成测试用例思路（一）代码实现（二）代码解释三、编写性能测试代码（一）代码实现（二）代码解释四、执行测试并分析结果（一）执行测试（二）分析结果一、准备工作（一）安装Python确保你已安装Python3.8或更高版本。若未安装，可
python核心编程电子书_Python核心编程 PDF 超清第3版 weixin_39976733 python核心编程电子书
给大家带来的一篇关于Python编程相关的电子书资源，介绍了关于Python编程、Python核心编程方面的内容，本书是由人民邮电出版社出版，格式为PDF，资源大小22.4MB，卫斯理编写，目前豆瓣、亚马逊、当当、京东等电子书综合评分为：7.5。内容介绍全方位包含现如今应用程序开发中的诸多行业为初级Python开发者出示优秀实践活动方式包含很多好用的编码实例每章结尾的练习题有利于推进所教专业知识想
Go 语言 `map` 详解翱翔-蓝天 go golang 开发语言后端
Go语言map详解1.什么是map？在Go语言中，map是一种键值对（key-value）数据结构，类似于Python的dict或Java的HashMap。它提供了高效的查找、插入和删除操作。2.map的声明与初始化在Go中，可以使用make()或直接字面量方式创建map。方式1：使用make()m:=make(map[string]int)//创建一个键类型为string，值类型为int的map
ASM系列五利用TreeApi 解析生成Class lijingyao8206 ASM 字节码动态生成 ClassNode TreeAPI
前面CoreApi的介绍部分基本涵盖了ASMCore包下面的主要API及功能，其中还有一部分关于MetaData的解析和生成就不再赘述。这篇开始介绍ASM另一部分主要的Api。TreeApi。这一部分源码是关联的asm-tree-5.0.4的版本。在介绍前，先要知道一点， Tree工程的接口基本可以完
链表树——复合数据结构应用实例 bardo 数据结构树型结构表结构设计链表菜单排序
我们清楚：数据库设计中，表结构设计的好坏，直接影响程序的复杂度。所以，本文就无限级分类（目录）树与链表的复合在表设计中的应用进行探讨。当然，什么是树，什么是链表，这里不作介绍。有兴趣可以去看相关的教材。需求简介：经常遇到这样的需求，我们希望能将保存在数据库中的树结构能够按确定的顺序读出来。比如，多级菜单、组织结构、商品分类。更具体的，我们希望某个二级菜单在这一级别中就是第一个。虽然它是最后
为啥要用位运算代替取模呢 chenchao051 位运算哈希汇编
在hash中查找key的时候，经常会发现用&取代%，先看两段代码吧， JDK6中的HashMap中的indexFor方法： /** * Returns index for hash code h. */ static int indexFor(int h, int length) {
最近的情况麦田的设计者生活感悟计划软考想
今天是2015年4月27号整理一下最近的思绪以及要完成的任务 1、最近在驾校科目二练车，每周四天，练三周。其实做什么都要用心，追求合理的途径解决。为
PHP去掉字符串中最后一个字符的方法 IT独行者 PHP 字符串
今天在PHP项目开发中遇到一个需求，去掉字符串中的最后一个字符原字符串1,2,3,4,5,6, 去掉最后一个字符","，最终结果为1,2,3,4,5,6 代码如下： $str = "1,2,3,4,5,6,"; $newstr = substr($str,0,strlen($str)-1); echo $newstr;
hadoop在linux上单机安装过程 _wy_ linux hadoop
1、安装JDK jdk版本最好是1.6以上，可以使用执行命令java -version查看当前JAVA版本号，如果报命令不存在或版本比较低，则需要安装一个高版本的JDK，并在/etc/profile的文件末尾，根据本机JDK实际的安装位置加上以下几行： export JAVA_HOME=/usr/java/jdk1.7.0_25
JAVA进阶----分布式事务的一种简单处理方法无量多系统交互分布式事务
每个方法都是原子操作：提供第三方服务的系统，要同时提供执行方法和对应的回滚方法 A系统调用B,C,D系统完成分布式事务 =========执行开始======== A.aa(); try { B.bb(); } catch(Exception e) { A.rollbackAa(); } try { C.cc(); } catch(Excep
安墨移动广告：移动DSP厚积薄发引领未来广告业发展命脉矮蛋蛋 hadoop 互联网
　　“谁掌握了强大的DSP技术，谁将引领未来的广告行业发展命脉。”2014年，移动广告行业的热点非移动DSP莫属。各个圈子都在纷纷谈论，认为移动DSP是行业突破点，一时间许多移动广告联盟风起云涌，竞相推出专属移动DSP产品。　　到底什么是移动DSP呢? 　　DSP(Demand-SidePlatform)，就是需求方平台，为解决广告主投放的各种需求，真正实现人群定位的精准广
myelipse设置 alafqq IP
在一个项目的完整的生命周期中，其维护费用，往往是其开发费用的数倍。因此项目的可维护性、可复用性是衡量一个项目好坏的关键。而注释则是可维护性中必不可少的一环。注释模板导入步骤安装方法：打开eclipse/myeclipse 选择 window-->Preferences-->JAVA-->Code-->Code
java数组百合不是茶 java数组
java数组的声明创建初始化； java支持C语言数组中的每个数都有唯一的一个下标一维数组的定义声明： int[] a = new int[3];声明数组中有三个数int[3] int[] a 中有三个数，下标从0开始，可以同过for来遍历数组中的数
javascript读取表单数据 bijian1013 JavaScript
利用javascript读取表单数据，可以利用以下三种方法获取： 1、通过表单ID属性：var a = document.getElementByIdx_x_x("id"); 2、通过表单名称属性：var b = document.getElementsByName("name"); 3、直接通过表单名字获取：var c = form.content.
探索JUnit4扩展：使用Theory bijian1013 java JUnit Theory
理论机制（Theory）一.为什么要引用理论机制（Theory）当今软件开发中，测试驱动开发（TDD — Test-driven development）越发流行。为什么 TDD 会如此流行呢？因为它确实拥有很多优点，它允许开发人员通过简单的例子来指定和表明他们代码的行为意图。 TDD 的优点： &nb
[Spring Data Mongo一]Spring Mongo Template操作MongoDB bit1129 template
什么是Spring Data Mongo Spring Data MongoDB项目对访问MongoDB的Java客户端API进行了封装，这种封装类似于Spring封装Hibernate和JDBC而提供的HibernateTemplate和JDBCTemplate，主要能力包括 1. 封装客户端跟MongoDB的链接管理 2. 文档-对象映射，通过注解:@Document(collectio
【Kafka八】Zookeeper上关于Kafka的配置信息 bit1129 zookeeper
问题： 1. Kafka的哪些信息记录在Zookeeper中 2. Consumer Group消费的每个Partition的Offset信息存放在什么位置 3. Topic的每个Partition存放在哪个Broker上的信息存放在哪里 4. Producer跟Zookeeper究竟有没有关系？没有关系！！！ //consumers、config、brokers、cont
java OOM内存异常的四种类型及异常与解决方案 ronin47 java OOM 内存异常
　OOM异常的四种类型：　　　　　一：　StackOverflowError ：通常因为递归函数引起（死递归，递归太深）。-Xss 128k 一般够用。　二：　out Of memory: PermGen Space：通常是动态类大多，比如web 服务器自动更新部署时引起。-Xmx
java-实现链表反转-递归和非递归实现 bylijinnan java
20120422更新：对链表中部分节点进行反转操作，这些节点相隔k个： 0->1->2->3->4->5->6->7->8->9 k=2 8->1->6->3->4->5->2->7->0->9 注意1 3 5 7 9 位置是不变的。解法：将链表拆成两部分： a.0-&
Netty源码学习-DelimiterBasedFrameDecoder bylijinnan java netty
看DelimiterBasedFrameDecoder的API，有举例：接收到的ChannelBuffer如下： +--------------+ | ABC\nDEF\r\n | +--------------+ 经过DelimiterBasedFrameDecoder(Delimiters.lineDelimiter())之后，得到： +-----+----
linux的一些命令 -查看cc攻击-网口ip统计等 hotsunshine linux
Linux判断CC攻击命令详解 2011年12月23日 ⁄ 安全 ⁄ 暂无评论查看所有80端口的连接数 netstat -nat|grep -i '80'|wc -l 对连接的IP按连接数量进行排序 netstat -ntu | awk '{print $5}' | cut -d: -f1 | sort | uniq -c | sort -n 查看TCP连接状态 n
Spring获取SessionFactory ctrain sessionFactory
String sql = "select sysdate from dual"; WebApplicationContext wac = ContextLoader.getCurrentWebApplicationContext(); String[] names = wac.getBeanDefinitionNames(); for(int i=0; i&
Hive几种导出数据方式 daizj hive 数据导出
Hive几种导出数据方式 1.拷贝文件如果数据文件恰好是用户需要的格式，那么只需要拷贝文件或文件夹就可以。 hadoop fs –cp source_path target_path 2.导出到本地文件系统 --不能使用insert into local directory来导出数据，会报错 --只能使用
编程之美 dcj3sjt126com 编程 PHP 重构
我个人的 PHP 编程经验中，递归调用常常与静态变量使用。静态变量的含义可以参考 PHP 手册。希望下面的代码，会更有利于对递归以及静态变量的理解 header("Content-type: text/plain"); function static_function () { static $i = 0; if ($i++ < 1
Android保存用户名和密码 dcj3sjt126com android
转自：http://www.2cto.com/kf/201401/272336.html 我们不管在开发一个项目或者使用别人的项目，都有用户登录功能，为了让用户的体验效果更好，我们通常会做一个功能，叫做保存用户，这样做的目地就是为了让用户下一次再使用该程序不会重新输入用户名和密码，这里我使用3种方式来存储用户名和密码 1、通过普通的txt文本存储 2、通过properties属性文件进行存
Oracle 复习笔记之同义词 eksliang Oracle 同义词 Oracle synonym
转载请出自出处：http://eksliang.iteye.com/blog/2098861 1.什么是同义词同义词是现有模式对象的一个别名。概念性的东西，什么是模式呢？创建一个用户，就相应的创建了一个模式。模式是指数据库对象，是对用户所创建的数据对象的总称。模式对象包括表、视图、索引、同义词、序列、过
Ajax案例 gongmeitao Ajax jsp
数据库采用Sql Server2005 项目名称为:Ajax_Demo 1.com.demo.conn包 package com.demo.conn; import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQLException; //获取数据库连接的类public class DBConnec
ASP.NET中Request.RawUrl、Request.Url的区别 hvt .net Web C#asp.net hovertree
如果访问的地址是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree%3C&n=myslider#zonemenu那么Request.Url.ToString() 的值是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree<&
SVG 教程（七）SVG 实例，SVG 参考手册天梯梦 svg
SVG 实例在线实例下面的例子是把SVG代码直接嵌入到HTML代码中。谷歌Chrome，火狐，Internet Explorer9，和Safari都支持。注意：下面的例子将不会在Opera运行，即使Opera支持SVG - 它也不支持SVG在HTML代码中直接使用。 SVG 实例 SVG基本形状一个圆矩形不透明矩形一个矩形不透明2 一个带圆角矩
事务管理 luyulong java spring 编程事务
事物管理 spring事物的好处为不同的事物API提供了一致的编程模型支持声明式事务管理提供比大多数事务API更简单更易于使用的编程式事务管理API 整合spring的各种数据访问抽象 TransactionDefinition 定义了事务策略 int getIsolationLevel()得到当前事务的隔离级别 READ_COMMITTED
基础数据结构和算法十一：Red-black binary search tree sunwinner Algorithm Red-black
The insertion algorithm for 2-3 trees just described is not difficult to understand; now, we will see that it is also not difficult to implement. We will consider a simple representation known
centos同步时间 stunizhengjia linux 集群同步时间
做了集群，时间的同步就显得非常必要了。以下是查到的如何做时间同步。在CentOS 5不再区分客户端和服务器，只要配置了NTP，它就会提供NTP服务。 1)确认已经ntp程序包： # yum install ntp 2)配置时间源（默认就行，不需要修改） # vi /etc/ntp.conf server pool.ntp.o
ITeye 9月技术图书有奖试读获奖名单公布 ITeye管理员 ITeye
ITeye携手博文视点举办的9月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 9月试读活动回顾：http://webmaster.iteye.com/blog/2118112本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《NFC：Arduino、Andro

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他