q:用SQL查询CSV文件数据

q是一个命令行工具,它支持在CSV以及TSV等表格类文件中执行类似SQL的查询。q可以把普通文档当作数据库表处理,并且支持 WHERE、GROUP BY、JOIN等语法,但暂时不支持WHERE内的子查询。q支持自动类型推导。目前q在GitHub获得1900+的关注量,当然版本为1.4.0。

q本身是一个使用Python编写的内存数据库,使用也非常简单,基本没有学习成本,只要把之前写数据库表的地方换为对应的文件地址即可,比如:

q -H -t “SELECT COUNT(DISTINCT(uuid)) FROM ./clicks.csv”

具体的使用方法以及例子读者可以移步官网详细了解。

q是一个简单而高效的小工具,亮点是便捷,所以未过多关注性能方面的问题,当前也只适合处理小数据,在使用时需要注意q暂时不支持处理文件名中带空格的文件。目前q的官网上提供了Mac、Windows、​Debian、CentOS等系统的安装文件,感兴趣的读者请自行下载安装。

你可能感兴趣的:(q:用SQL查询CSV文件数据)