数据集的构造---faker库

学数据分析,没有数据怎么办?

做数据测试,没有数据怎么办?

如果要是手动制造数据的话,肯定要花费大把精力,这显然是不符合我们程序员的作风的。

那该怎么办呢?

快来使用Faker这个Python库吧,它可以生成各种各样的伪数据。

它可以制造很多数据,比如,姓名,地址,身份证号(随机制造的,不要担心是违法的)

安装库

pip安装

pip install Faker

IDE安装

直接在setting中搜索Faker即可,但需要注意的是这种方法可能会安装失败,这个时候换一下安装的版本就行了,造成这种情况的原因可能是你所用的python解释器的版本与Faker的高版本不兼容.

基本使用

引入模块

from faker import Faker

实例化对象

fake = Faker()

在实例化中传入相应的参数可以得到不同国家的随机数据集信息

ar_EG - Arabic (Egypt)
ar_PS - Arabic (Palestine)
ar_SA - Arabic (Saudi Arabia)
bg_BG - Bulgarian
bs_BA - Bosnian
cs_CZ - Czech
de_DE - German
dk_DK - Danish
el_GR - Greek
en_AU - English (Australia)
en_CA - English (Canada)
en_GB - English (Great Britain)
en_NZ - English (New Zealand)
en_US - English (United States)
es_ES - Spanish (Spain)
es_MX - Spanish (Mexico)
et_EE - Estonian
fa_IR - Persian (Iran)
fi_FI - Finnish
fr_FR - French
hi_IN - Hindi
hr_HR - Croatian
hu_HU - Hungarian
hy_AM - Armenian
it_IT - Italian
ja_JP - Japanese
ka_GE - Georgian (Georgia)
ko_KR - Korean
lt_LT - Lithuanian
lv_LV - Latvian
ne_NP - Nepali
nl_NL - Dutch (Netherlands)
no_NO - Norwegian
pl_PL - Polish
pt_BR - Portuguese (Brazil)
pt_PT - Portuguese (Portugal)
ro_RO - Romanian
ru_RU - Russian
sl_SI - Slovene
sv_SE - Swedish
tr_TR - Turkish
uk_UA - Ukrainian
zh_CN - Chinese (China Mainland)
zh_TW - Chinese (China Taiwan)

产生所要的随机信息

这个库对象的方法非常非常的多,在这里就不一一列举了,

大家可以到官方文档那里看

或者给大家推荐两篇文章,上面非常的清楚

https://zhuanlan.zhihu.com/p/87203290

https://zhuanlan.zhihu.com/p/138996322

你可能感兴趣的:(数据分析,python)