测试数据生成工具datafaker

一、开源情况

datafaker是一个大批量测试数据和流测试数据生成工具，兼容python2.7和python3.4+，欢迎下载使用。github地址为：

https://github.com/gangly/datafaker

文档同步更新在github

在软件开发测试过程，经常需要测试数据。这些场景包括：

常用方法是人工手动造几条数据写入数据库，这种方法带来的弊端是

浪费工时
针对表的不同数据类型的字段，需要构造不同数据
数据量小
如果需要构造大量数据，手动造数据无能为力
不够准确
比如需要构造邮箱（满足一定格式），电话号码（确定的数字位数），ip地址（固定格式），年龄（不能为负数，有大小范围）等。这些测试数据有一定的限制或规律，手工构造可能不能满足数据范围或一些格式要求而导致后端程序报错
多表关联
手动造的数据量较小，在多个表中用主键不一定能关联上，或者关联出来没数据
动态随机写入
比如针对流数据，需要随机每隔几秒钟写入kafka。或者动态随机插入mysql，手工操作相对麻烦，而且不好统计写入数据条数

datafaker是一个多数据源测试数据构造工具，可以模拟产生大部分常用数据类型，具有以下功能：

datafaker是用python编写，支持python2.7，python3.4+。已经发布在pypi上，https://pypi.org/search/?q=datafaker。

datafaker.png

架构图完整的画出了工具的执行过程，从图可知工具经历了5个模块：

首先确保已经安装python和pip
有两种安装方法：

方法1.下载安装
下载源码压缩包，解压后，到datafaker目录里面执行：

python setup.py install

方法2.直接安装（此方法使用若有问题，请用方法1安装）

pip install datafaker