YanHua_jake

Pandas read_csv读取文本文件速度测试

问题发现

一、测试条件

1.测试环境

2.测试对象

二、测试程序

三、测试结果

1.Pandas1.0.3 read_csv读取文件

2.Pandas0.23.4 read_csv读取文件

3.Pandas0.24.1 read_csv读取文件

4.Pandas0.25.3 read_csv读取文件

总结和分析

1.测试总结

2.分析

问题发现

在将Pandas升级到1.0.x版本后发现read_csv函数相比之前的版本，在读取文本文件时速度大幅变慢。

本文根据这个问题做一个测试记录问题情况，寻找有效的解决方法。

一、测试条件

分别在Pandas 1.0.3、0.23.4、0.24.1、0.25.3版本下测试，pd.read_csv函数读取144MB的txt文件的速度。

1.测试环境

基本运行平台：Windows 7 64位，Python 3.7.7。

详细测试配置：

Pandas 1.0.3

INSTALLED VERSIONS
------------------
commit           : None
python           : 3.7.7.final.0
python-bits      : 64
OS               : Windows
OS-release       : 7
machine          : AMD64
processor        : Intel64 Family 6 Model 78 Stepping 3, GenuineIntel
byteorder        : little
LC_ALL           : None
LANG             : None
LOCALE           : Chinese (Simplified)_People's Republic of China.936

pandas           : 1.0.3
numpy            : 1.18.4
pytz             : 2020.1
dateutil         : 2.8.1
pip              : 19.2.3
setuptools       : 41.2.0
Cython           : None
pytest           : None
hypothesis       : None
sphinx           : None
blosc            : None
feather          : None
xlsxwriter       : None
lxml.etree       : None
html5lib         : None
pymysql          : None
psycopg2         : None
jinja2           : None
IPython          : None
pandas_datareader: None
bs4              : None
bottleneck       : None
fastparquet      : None
gcsfs            : None
lxml.etree       : None
matplotlib       : 3.1.1
numexpr          : 2.7.1
odfpy            : None
openpyxl         : 3.0.5
pandas_gbq       : None
pyarrow          : None
pytables         : None
pytest           : None
pyxlsb           : None
s3fs             : None
scipy            : 1.4.1
sqlalchemy       : None
tables           : 3.6.1
tabulate         : None
xarray           : None
xlrd             : 1.2.0
xlwt             : None
xlsxwriter       : None
numba            : None

Pandas 0.23.4

INSTALLED VERSIONS
------------------
commit: None
python: 3.7.7.final.0
python-bits: 64
OS: Windows
OS-release: 7
machine: AMD64
processor: Intel64 Family 6 Model 78 Stepping 3, GenuineIntel
byteorder: little
LC_ALL: None
LANG: None
LOCALE: Chinese (Simplified)_People's Republic of China.936

pandas: 0.23.4
pytest: None
pip: 19.2.3
setuptools: 41.2.0
Cython: None
numpy: 1.18.4
scipy: 1.4.1
pyarrow: None
xarray: None
IPython: None
sphinx: None
patsy: None
dateutil: 2.8.1
pytz: 2020.1
blosc: None
bottleneck: None
tables: 3.6.1
numexpr: 2.7.1
feather: None
matplotlib: 3.1.1
openpyxl: 3.0.5
xlrd: 1.2.0
xlwt: None
xlsxwriter: None
lxml: None
bs4: None
html5lib: None
sqlalchemy: None
pymysql: None
psycopg2: None
jinja2: None
s3fs: None
fastparquet: None
pandas_gbq: None
pandas_datareader: None

Pandas0.24.1

INSTALLED VERSIONS
------------------
commit: None
python: 3.7.7.final.0
python-bits: 64
OS: Windows
OS-release: 7
machine: AMD64
processor: Intel64 Family 6 Model 78 Stepping 3, GenuineIntel
byteorder: little
LC_ALL: None
LANG: None
LOCALE: Chinese (Simplified)_People's Republic of China.936

pandas: 0.24.1
pytest: None
pip: 19.2.3
setuptools: 41.2.0
Cython: None
numpy: 1.18.4
scipy: 1.4.1
pyarrow: None
xarray: None
IPython: None
sphinx: None
patsy: None
dateutil: 2.8.1
pytz: 2020.1
blosc: None
bottleneck: None
tables: 3.6.1
numexpr: 2.7.1
feather: None
matplotlib: 3.1.1
openpyxl: 3.0.5
xlrd: 1.2.0
xlwt: None
xlsxwriter: None
lxml.etree: None
bs4: None
html5lib: None
sqlalchemy: None
pymysql: None
psycopg2: None
jinja2: None
s3fs: None
fastparquet: None
pandas_gbq: None
pandas_datareader: None
gcsfs: None

Pandas0.25.3

INSTALLED VERSIONS
------------------
commit           : None
python           : 3.7.7.final.0
python-bits      : 64
OS               : Windows
OS-release       : 7
machine          : AMD64
processor        : Intel64 Family 6 Model 78 Stepping 3, GenuineIntel
byteorder        : little
LC_ALL           : None
LANG             : None
LOCALE           : Chinese (Simplified)_People's Republic of China.936

pandas           : 0.25.3
numpy            : 1.18.4
pytz             : 2020.1
dateutil         : 2.8.1
pip              : 19.2.3
setuptools       : 41.2.0
Cython           : None
pytest           : None
hypothesis       : None
sphinx           : None
blosc            : None
feather          : None
xlsxwriter       : None
lxml.etree       : None
html5lib         : None
pymysql          : None
psycopg2         : None
jinja2           : None
IPython          : None
pandas_datareader: None
bs4              : None
bottleneck       : None
fastparquet      : None
gcsfs            : None
lxml.etree       : None
matplotlib       : 3.1.1
numexpr          : 2.7.1
odfpy            : None
openpyxl         : 3.0.5
pandas_gbq       : None
pyarrow          : None
pytables         : None
s3fs             : None
scipy            : 1.4.1
sqlalchemy       : None
tables           : 3.6.1
xarray           : None
xlrd             : 1.2.0
xlwt             : None
xlsxwriter       : None

2.测试对象

pd.read_csv函数读取的文件大小为144MB，文件内容为表格式数据的时间历程数据，数据按列以\t分隔。

二、测试程序

测试代码如下：

import profile
import pandas as pd
path = r'C:\testdata\testdata1.txt'

def test():
    df = pd.read_csv(path, sep='\s+', engine='c')


profile.run('test()')

三、测试结果

1.Pandas1.0.3 read_csv读取文件

如下所示，Pandas1.0.3读取文件共耗时112.922秒，其中C engine的read函数部分112.492秒，占了耗时的绝大部分。

30826 function calls (30667 primitive calls) in 112.992 seconds

   Ordered by: standard name

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        8    0.000    0.000    0.000    0.000 :0(__new__)
       19    0.000    0.000    0.016    0.001 :0(_abc_instancecheck)
    65/10    0.016    0.000    0.016    0.002 :0(_abc_subclasscheck)
      9/8    0.000    0.000    0.000    0.000 :0(all)
        6    0.000    0.000    0.000    0.000 :0(any)
       59    0.000    0.000    0.000    0.000 :0(append)
        3    0.000    0.000    0.000    0.000 :0(arange)
       49    0.000    0.000    0.000    0.000 :0(array)
        2    0.000    0.000    0.000    0.000 :0(array_equivalent_object)
        1    0.000    0.000    0.000    0.000 :0(callable)
        2    0.000    0.000    0.000    0.000 :0(clean_index_list)
        1    0.000    0.000    0.000    0.000 :0(close)
        2    0.000    0.000    0.000    0.000 :0(copy)
        8    0.000    0.000    0.000    0.000 :0(empty)
        4    0.000    0.000    0.000    0.000 :0(endswith)
        6    0.000    0.000    0.000    0.000 :0(ensure_object)
        1    0.000    0.000  112.992  112.992 :0(exec)
        2    0.000    0.000    0.000    0.000 :0(extend)
        2    0.000    0.000    0.000    0.000 :0(fill)
        1    0.000    0.000    0.000    0.000 :0(find)
       29    0.000    0.000    0.000    0.000 :0(format)
        3    0.000    0.000    0.000    0.000 :0(fspath)
       66    0.000    0.000    0.000    0.000 :0(get)
     5685    0.078    0.000    0.078    0.000 :0(getattr)
        4    0.000    0.000    0.000    0.000 :0(geterrobj)
        1    0.000    0.000    0.000    0.000 :0(getfilesystemencoding)
      169    0.000    0.000    0.000    0.000 :0(hasattr)
       17    0.000    0.000    0.000    0.000 :0(hash)
       29    0.250    0.009    0.250    0.009 :0(implement_array_function)
        1    0.000    0.000    0.000    0.000 :0(infer_datetimelike_array)
        4    0.016    0.004    0.016    0.004 :0(infer_dtype)
        1    0.000    0.000    0.000    0.000 :0(is_bool)
        1    0.000    0.000    0.000    0.000 :0(is_datetime_array)
       29    0.000    0.000    0.000    0.000 :0(is_float)
        2    0.000    0.000    0.000    0.000 :0(is_integer)
       13    0.000    0.000    0.000    0.000 :0(is_list_like)
       35    0.000    0.000    0.016    0.000 :0(is_scalar)
     6356    0.078    0.000    0.218    0.000 :0(isinstance)
        1    0.000    0.000    0.000    0.000 :0(isnaobj)
     3102    0.016    0.000    0.016    0.000 :0(issubclass)
        6    0.000    0.000    0.000    0.000 :0(items)
        1    0.000    0.000    0.000    0.000 :0(iter)
  167/124    0.000    0.000    0.000    0.000 :0(len)
        1    0.000    0.000    0.000    0.000 :0(lower)
        1    0.000    0.000    0.000    0.000 :0(next)
        1    0.000    0.000    0.000    0.000 :0(ord)
       19    0.000    0.000    0.000    0.000 :0(pop)
        5    0.000    0.000    0.000    0.000 :0(ravel)
        1  111.837  111.837  112.492  112.492 :0(read)

2.Pandas0.23.4 read_csv读取文件

如下所示，Pandas0.23.4读取文件共耗时132.195秒，其中C engine的read函数部分131.680秒，占了耗时的绝大部分。

10284 function calls (10161 primitive calls) in 132.195 seconds

   Ordered by: standard name

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
      8/4    0.000    0.000    0.016    0.004 :0(__import__)
        7    0.000    0.000    0.000    0.000 :0(__new__)
        6    0.000    0.000    0.000    0.000 :0(_abc_instancecheck)
     45/3    0.000    0.000    0.000    0.000 :0(_abc_subclasscheck)
       40    0.000    0.000    0.000    0.000 :0(acquire_lock)
      6/5    0.000    0.000    0.000    0.000 :0(all)
       24    0.000    0.000    0.000    0.000 :0(allocate_lock)
        3    0.000    0.000    0.000    0.000 :0(any)
       59    0.000    0.000    0.000    0.000 :0(append)
        3    0.000    0.000    0.000    0.000 :0(arange)
       43    0.000    0.000    0.000    0.000 :0(array)
        2    0.000    0.000    0.000    0.000 :0(array_equivalent_object)
        1    0.000    0.000    0.000    0.000 :0(callable)
        2    0.000    0.000    0.000    0.000 :0(clean_index_list)
        1    0.000    0.000    0.000    0.000 :0(close)
        3    0.000    0.000    0.000    0.000 :0(copy)
        8    0.016    0.002    0.016    0.002 :0(empty)
        4    0.000    0.000    0.000    0.000 :0(endswith)
        6    0.000    0.000    0.000    0.000 :0(ensure_object)
        1    0.000    0.000  132.180  132.180 :0(exec)
        2    0.000    0.000    0.000    0.000 :0(extend)
        2    0.000    0.000    0.000    0.000 :0(fill)
        1    0.000    0.000    0.000    0.000 :0(find)
    39/38    0.000    0.000    0.000    0.000 :0(format)
        1    0.000    0.000    0.000    0.000 :0(fspath)
       91    0.000    0.000    0.000    0.000 :0(get)
       24    0.000    0.000    0.000    0.000 :0(get_ident)
      313    0.000    0.000    0.000    0.000 :0(getattr)
        4    0.000    0.000    0.000    0.000 :0(geterrobj)
        1    0.000    0.000    0.000    0.000 :0(getfilesystemencoding)
       84    0.000    0.000    0.000    0.000 :0(hasattr)
       30    0.328    0.011    0.328    0.011 :0(implement_array_function)
        1    0.000    0.000    0.000    0.000 :0(infer_datetimelike_array)
        3    0.000    0.000    0.000    0.000 :0(infer_dtype)
        1    0.000    0.000    0.000    0.000 :0(is_bool)
        2    0.000    0.000    0.000    0.000 :0(is_builtin)
        1    0.000    0.000    0.000    0.000 :0(is_datetime_array)
        4    0.000    0.000    0.000    0.000 :0(is_frozen)
        3    0.000    0.000    0.000    0.000 :0(is_integer)
       35    0.000    0.000    0.000    0.000 :0(is_scalar)
     2055    0.016    0.000    0.016    0.000 :0(isinstance)
        1    0.000    0.000    0.000    0.000 :0(isnaobj)
     1976    0.016    0.000    0.016    0.000 :0(issubclass)
       10    0.000    0.000    0.000    0.000 :0(items)
        9    0.000    0.000    0.000    0.000 :0(iter)
       90    0.000    0.000    0.000    0.000 :0(join)
  134/123    0.000    0.000    0.000    0.000 :0(len)
        1    0.000    0.000    0.000    0.000 :0(lower)
       32    0.000    0.000    0.000    0.000 :0(max)
        1    0.000    0.000    0.000    0.000 :0(next)
        1    0.000    0.000    0.000    0.000 :0(ord)
       18    0.000    0.000    0.000    0.000 :0(pop)
        5    0.000    0.000    0.000    0.000 :0(ravel)
        1  131.212  131.212  131.680  131.680 :0(read)

3.Pandas0.24.1 read_csv读取文件

如下所示，Pandas0.24.1读取文件共耗时18.096秒，其中C engine的read函数部分17.503秒，读取速度相比其它版本要快很多。

30648 function calls (30495 primitive calls) in 18.096 seconds

   Ordered by: standard name

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
      8/4    0.000    0.000    0.016    0.004 :0(__import__)
        8    0.000    0.000    0.000    0.000 :0(__new__)
       17    0.000    0.000    0.000    0.000 :0(_abc_instancecheck)
    67/10    0.000    0.000    0.000    0.000 :0(_abc_subclasscheck)
       40    0.000    0.000    0.000    0.000 :0(acquire_lock)
      6/5    0.000    0.000    0.000    0.000 :0(all)
       24    0.000    0.000    0.000    0.000 :0(allocate_lock)
        3    0.000    0.000    0.000    0.000 :0(any)
       59    0.000    0.000    0.000    0.000 :0(append)
        3    0.000    0.000    0.000    0.000 :0(arange)
       43    0.000    0.000    0.000    0.000 :0(array)
        2    0.000    0.000    0.000    0.000 :0(array_equivalent_object)
        1    0.000    0.000    0.000    0.000 :0(callable)
        2    0.000    0.000    0.000    0.000 :0(clean_index_list)
        1    0.000    0.000    0.000    0.000 :0(close)
        3    0.000    0.000    0.000    0.000 :0(copy)
        8    0.016    0.002    0.016    0.002 :0(empty)
        4    0.016    0.004    0.016    0.004 :0(endswith)
        6    0.000    0.000    0.000    0.000 :0(ensure_object)
        1    0.000    0.000   18.096   18.096 :0(exec)
        2    0.000    0.000    0.000    0.000 :0(extend)
        2    0.000    0.000    0.000    0.000 :0(fill)
        1    0.000    0.000    0.000    0.000 :0(find)
    39/38    0.000    0.000    0.000    0.000 :0(format)
        3    0.000    0.000    0.000    0.000 :0(fspath)
       93    0.000    0.000    0.000    0.000 :0(get)
       24    0.000    0.000    0.000    0.000 :0(get_ident)
     5506    0.031    0.000    0.031    0.000 :0(getattr)
        4    0.000    0.000    0.000    0.000 :0(geterrobj)
        1    0.000    0.000    0.000    0.000 :0(getfilesystemencoding)
      123    0.000    0.000    0.000    0.000 :0(hasattr)
        1    0.000    0.000    0.000    0.000 :0(hash)
       30    0.265    0.009    0.265    0.009 :0(implement_array_function)
        1    0.000    0.000    0.000    0.000 :0(infer_datetimelike_array)
        4    0.016    0.004    0.016    0.004 :0(infer_dtype)
        1    0.000    0.000    0.000    0.000 :0(is_bool)
        2    0.000    0.000    0.000    0.000 :0(is_builtin)
        1    0.000    0.000    0.000    0.000 :0(is_datetime_array)
       29    0.000    0.000    0.000    0.000 :0(is_float)
        4    0.000    0.000    0.000    0.000 :0(is_frozen)
        3    0.000    0.000    0.000    0.000 :0(is_integer)
       35    0.000    0.000    0.000    0.000 :0(is_scalar)
     6001    0.062    0.000    0.187    0.000 :0(isinstance)
        1    0.000    0.000    0.000    0.000 :0(isnaobj)
     2989    0.031    0.000    0.031    0.000 :0(issubclass)
       10    0.000    0.000    0.000    0.000 :0(items)
        8    0.000    0.000    0.000    0.000 :0(iter)
       90    0.000    0.000    0.000    0.000 :0(join)
  135/124    0.000    0.000    0.000    0.000 :0(len)
        1    0.000    0.000    0.000    0.000 :0(lower)
       32    0.000    0.000    0.000    0.000 :0(max)
        1    0.000    0.000    0.000    0.000 :0(next)
        1    0.000    0.000    0.000    0.000 :0(ord)
       18    0.000    0.000    0.000    0.000 :0(pop)
        5    0.000    0.000    0.000    0.000 :0(ravel)
        1   16.692   16.692   17.503   17.503 :0(read)

4.Pandas0.25.3 read_csv读取文件

如下所示，Pandas0.25.3读取文件共耗时9.656秒，其中C engine的read函数部分9.157秒，读取速度又是0.24.1版本的两倍。

 29951 function calls (29800 primitive calls) in 9.656 seconds

   Ordered by: standard name

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        8    0.000    0.000    0.000    0.000 :0(__new__)
       15    0.000    0.000    0.000    0.000 :0(_abc_instancecheck)
     60/8    0.000    0.000    0.000    0.000 :0(_abc_subclasscheck)
      6/5    0.000    0.000    0.016    0.003 :0(all)
        3    0.000    0.000    0.000    0.000 :0(any)
       59    0.000    0.000    0.000    0.000 :0(append)
        3    0.000    0.000    0.000    0.000 :0(arange)
       43    0.000    0.000    0.000    0.000 :0(array)
        2    0.000    0.000    0.000    0.000 :0(array_equivalent_object)
        1    0.000    0.000    0.000    0.000 :0(callable)
        2    0.000    0.000    0.000    0.000 :0(clean_index_list)
        1    0.016    0.016    0.016    0.016 :0(close)
        2    0.000    0.000    0.000    0.000 :0(copy)
        8    0.016    0.002    0.016    0.002 :0(empty)
        4    0.000    0.000    0.000    0.000 :0(endswith)
        6    0.000    0.000    0.000    0.000 :0(ensure_object)
        1    0.000    0.000    9.641    9.641 :0(exec)
        2    0.000    0.000    0.000    0.000 :0(extend)
        2    0.000    0.000    0.000    0.000 :0(fill)
        1    0.000    0.000    0.000    0.000 :0(find)
    35/34    0.000    0.000    0.000    0.000 :0(format)
        3    0.000    0.000    0.000    0.000 :0(fspath)
       67    0.000    0.000    0.000    0.000 :0(get)
     5561    0.047    0.000    0.047    0.000 :0(getattr)
        4    0.000    0.000    0.000    0.000 :0(geterrobj)
        1    0.000    0.000    0.000    0.000 :0(getfilesystemencoding)
      103    0.000    0.000    0.000    0.000 :0(hasattr)
        1    0.000    0.000    0.000    0.000 :0(hash)
       29    0.218    0.008    0.218    0.008 :0(implement_array_function)
        1    0.000    0.000    0.000    0.000 :0(infer_datetimelike_array)
        4    0.016    0.004    0.016    0.004 :0(infer_dtype)
        1    0.000    0.000    0.000    0.000 :0(is_bool)
        1    0.000    0.000    0.000    0.000 :0(is_datetime_array)
       29    0.000    0.000    0.000    0.000 :0(is_float)
        2    0.000    0.000    0.000    0.000 :0(is_integer)
        9    0.000    0.000    0.000    0.000 :0(is_list_like)
       34    0.000    0.000    0.000    0.000 :0(is_scalar)
     6155    0.140    0.000    0.172    0.000 :0(isinstance)
        1    0.000    0.000    0.000    0.000 :0(isnaobj)
     3054    0.016    0.000    0.016    0.000 :0(issubclass)
       10    0.000    0.000    0.000    0.000 :0(items)
        1    0.000    0.000    0.000    0.000 :0(iter)
  166/123    0.000    0.000    0.000    0.000 :0(len)
        1    0.000    0.000    0.000    0.000 :0(lower)
        1    0.000    0.000    0.000    0.000 :0(next)
        1    0.000    0.000    0.000    0.000 :0(ord)
       19    0.000    0.000    0.000    0.000 :0(pop)
        5    0.000    0.000    0.000    0.000 :0(ravel)
        1    8.440    8.440    9.157    9.157 :0(read)

总结和分析

1.测试总结

根据以上测试结果，在Win7系统Python3.7.7环境下，Pandas不同版本读取144MB的表式文本文件时间为：

Pandas版本	read_csv耗时
0.23.4	132.195s
0.24.1	18.096s
0.25.3	9.656s
1.0.3	112.922s

2.分析

参考Pandas的github issue #23516：https://github.com/pandas-dev/pandas/issues/23516，Python3.7.x和Pandas0.23.4环境下read_csv由于isdigit函数调用问题造成了3.5倍的速度延迟，这个问题在0.24.0版本已经解决，因此可以看到本测试中0.24.1相比0.23.4读取速度显著提高。

Pandas0.25.x版本比0.24.x版本相比速度更快，具体原因不清楚。

Pandas1.0.x版本速度再次大幅变慢，具体原因不清楚。

后续可以继续测试Python其它版本下Pandas read_csv函数的性能情况。

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
有必要获得WHQL测试认证吗，有什么好处？
什么是WHQL认证？WHQL是MicrosoftWindowsHardwareQualityLab的缩写，中文意思是Windows硬件设备质量实验室，主要是对Windows操作系统的兼容性测试，检验硬件产品和驱动程序在windows系统下的兼容性和稳定性。当某一硬件或软件通过WHQL测试时，制造商可以在其产品包装和广告上使用“DesignedforWindows”标志。该标志可以证明硬件或软件已经
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
WHQL签名怎么申请 GDCA SSL证书 windows
WHQL（WindowsHardwareQualityLabs）签名是微软对硬件和驱动程序进行认证的一种方式，以确保它们与Windows操作系统的兼容性和稳定性。以下是申请WHQL签名的基本步骤，供您参考：1.准备阶段准备硬件设备和驱动程序：确保您的硬件设备已经准备好，并且对应的驱动程序已经经过充分的测试，能够在各种配置和环境下正常工作。获取EV代码签名证书：根据微软的要求，驱动程序进行WHQL认
JSON 与 AJAX Auscy json ajax 前端
一、JSON（JavaScriptObjectNotation）1.数据类型与语法细节支持的数据类型：基本类型：字符串（需用双引号）、数字、布尔值（true/false）、null。复杂类型：数组（[]）、对象（{}）。严格语法规范：键名必须用双引号包裹（如"name":"张三"）。数组元素用逗号分隔，最后一个元素后不能有多余逗号。数字不能以0开头（如012会被解析为12），不支持八进制/十六进制
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
python_虚拟环境阿_焦 python
第一、配置虚拟环境：virtualenv（1）pipvirtualenv>安装虚拟环境包（2）pipinstallvirtualenvwrapper-win>安装虚拟环境依赖包（3）c盘创建虚拟目录>C:\virtualenv>配置环境变量【了解一下】：（1）如何使用virtualenv创建虚拟环境a、cd到C:\virtualenv目录下：b、mkvirtualenvname>创建虚拟环境nam
前端项目架构设计要领
1.架构设计的核心目标在设计前端项目架构时，核心目标是模块化、可维护、可扩展、可测试，以及开发效率的最大化。这些目标可以通过以下几个方面来实现：组件化：将UI功能封装为可复用的组件。模块化：将业务逻辑分解为独立的模块或服务。自动化构建与部署：实现自动化构建、测试和部署流程，减少人为操作的错误。代码规范化与检查：确保团队协作时，代码风格和质量一致。2.项目目录结构设计一个清晰合理的目录结构对大型项目
Android 开源组件和第三方库汇总 gyyzzr Android Android 开源框架
转载1、github排名https://github.com/trending,github搜索：https://github.com/search2、https://github.com/wasabeef/awesome-android-ui目录UIUI卫星菜单节选器下拉刷新模糊效果HUD与Toast进度条UI其它动画网络相关响应式编程地图数据库图像浏览及处理视频音频处理测试及调试动态更新热更新
docker-compose方式搭建lnmp环境——筑梦之路筑梦之路 linux系统运维国产化 docker android adb
docker-compose.yml文件#生成docker-compose.ymlcat>docker-compose.ymlnginx/conf.d/default.conf">www/index.phpecho"开始启动服务..."docker-composeup-d#获取本机ipip_addr=$(hostname-I|awk'{print$1}')echo"部署完成！"echo"访问测试页
Python爱心光波
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
Python流星雨 Want595 python 开发语言
文章目录系列文章写在前面技术需求完整代码代码分析1.模块导入2.画布设置3.画笔设置4.颜色列表5.流星类(Star)6.流星对象创建7.主循环8.流星运动逻辑9.视觉效果10.总结写在后面系列文章序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python
Android ViewBinding 使用与封装教程积跬步DEV Android 开发实战大全 android
AndroidViewBinding使用与封装教程：一、ViewBinding是什么？核心功能：为每个XML布局文件自动生成一个绑定类（如ActivityMainBinding），直接暴露所有带ID的视图引用。优点：避免繁琐的findViewById()，类型安全且编译时检查。对比DataBinding：ViewBinding仅处理视图引用，无数据绑定功能。DataBinding支持双向数据绑定，
Python之七彩花朵代码实现 PlutoZuo Python python 开发语言
Python之七彩花朵代码实现文章目录Python之七彩花朵代码实现下面是一个简单的使用Python的七彩花朵。这个示例只是一个简单的版本，没有很多高级功能，但它可以作为一个起点，你可以在此基础上添加更多功能。importturtleastuimportrandomasraimportmathtu.setup(1.0,1.0)t=tu.Pen()t.ht()colors=['red','skybl
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
（Python基础篇）了解和使用分支结构 EternityArt 基础篇 python
目录一、引言二、Python分支结构的类型与语法（一）if语句（单分支）（二）if-else语句（双分支）（三）if-elif-else语句（多分支）三、分支结构的应用场景（一）提示用户输入用户名，然后再提示输入密码，如果用户名是“admin”并且密码是“88888”则提示正确，否则，如果用户名不是admin还提示用户用户名不存在,（二）提示用户输入用户名，然后再提示输入密码，如果用户名是“adm
（Python基础篇）循环结构 EternityArt 基础篇 python
一、什么是Python循环结构？循环结构是编程中重复执行代码块的机制。在Python中，循环允许你：1.迭代处理数据：遍历列表、字典、文件内容等。2.自动化重复任务：如批量处理数据、生成序列等。3.控制执行流程：根据条件决定是否继续或终止循环。二、为什么需要循环结构？假设你需要打印1到100的所有偶数：没有循环：需手动编写100行print()语句。print(0)print(2)print(4)
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
Python七彩花朵 Want595 python 开发语言
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
Cesium加载各类数据总结 zhu_zhu_xia cesium JavaScript javascript
接触到的加载数据类型：源地图、shp、Geojson、png、wms、地形底图一.Cesium加载各类底图#此类加载的本质在于newCesium.ImageryProvider()Apidefination：“Providesimagerytobedisplayedonthesurfaceofanellipsoid.Thistypedescribesaninterfaceandisnotinten
C++ 设计模式：抽象工厂（Abstract Factory）冀晓武 C++设计模式 c++设计模式抽象工厂模式
链接：C++设计模式链接：C++设计模式-工厂方法链接：C++设计模式-原型模式链接：C++设计模式-建造者模式抽象工厂（AbstractFactory）是一种创建型设计模式，它提供一个接口，用于创建一系列相关或相互依赖的对象，而无需指定它们的具体类。抽象工厂模式通常用于创建一组相关的产品对象，例如不同类型的机器人和它们的配件。1.问题分析在某些情况下，我们需要创建一组相关或相互依赖的对象，但我们
用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
Anaconda 详细下载与安装教程
Anaconda详细下载与安装教程1.简介Anaconda是一个用于科学计算的开源发行版，包含了Python和R的众多常用库。它还包括了conda包管理器，可以方便地安装、更新和管理各种软件包。2.下载Anaconda2.1访问官方网站首先，打开浏览器，访问Anaconda官方网站。2.2选择适合的版本在页面中，你会看到两个主要的下载选项：AnacondaIndividualEdition：适用于
本地包解决npm error code E404 雅痞yuppie npm 前端 node.js
这个错误提示表明npm找不到名为create-vue-admin-cli的包。这是因为你开发的CLI工具还没有发布到npm官方注册表。要解决这个问题，有两种方法：方法一：使用本地开发模式测试1.确保你的CLI已正确链接到全局在你的vue-admin-cli项目根目录下执行：npmlink这会在全局环境中创建一个符号链接，指向你本地的CLI项目。2.使用本地链接的CLI创建项目直接使用命令：vue-
python中 @注解及内置注解的使用方法总结以及完整示例慧一居士 Python python
在Python中，装饰器（Decorator）使用@符号实现，是一种修改函数/类行为的语法糖。它本质上是一个高阶函数，接受目标函数作为参数并返回包装后的函数。Python也提供了多个内置装饰器，如@property、@staticmethod、@classmethod等。一、核心概念装饰器本质：@decorator等价于func=decorator(func)执行时机：在函数/类定义时立即执行装饰
Java特性之设计模式【责任链模式】 Naijia_OvO Java特性 java 设计模式责任链模式
一、责任链模式概述顾名思义，责任链模式（ChainofResponsibilityPattern）为请求创建了一个接收者对象的链。这种模式给予请求的类型，对请求的发送者和接收者进行解耦。这种类型的设计模式属于行为型模式在这种模式中，通常每个接收者都包含对另一个接收者的引用。如果一个对象不能处理该请求，那么它会把相同的请求传给下一个接收者，依此类推主要解决：职责链上的处理者负责处理请求，客户只需要将
Python中的静态方法和类方法详解
在Python中，`@staticmethod`和`@classmethod`是两种装饰器，它们用于定义类中的方法，但是它们的行为和用途有所不同。###@staticmethod`@staticmethod`装饰器用于定义一个静态方法。静态方法不接收类或实例的引用作为第一个参数，因此它不能访问类的状态或实例的状态。静态方法可以看作是与类关联的普通函数，但它们可以通过类名直接调用。classMath
计算机网络技术 CZZDg 计算机网络
目录一.网络概述1.网络的概念2.网络发展是3.网络的四要素4.网络功能5.网络类型6.网络协议与标准7.网络中常见的概念8.网络拓补结构二.网络模型1.分层思想2.OSI七层模型3.TCP/IP五层模型4.数据的封装与解封装过程三.IP地址1.进制转换2.IP地址定义3.IP地址组成成分4.IP地址分类5.地址划分6、相关概念一.网络概述1.网络的概念两个主机通过传输介质和通信协议实现通信和资源
cesium添加原生MVT矢量瓦片方案 zhu_zhu_xia cesium vue arcgis cesium webgl javascript
项目中需要基于cesium接入mvt格式的服务并支持属性拾取查询，通过一系列预研测试，最后选择cesium-mvt-imagery-provider开源插件完成，关键源码信息如下：npmicesiumcesium-mvt-imagery-provider//安装依赖包//加载图层importCesiumMVTImageryProviderfrom"cesium-mvt-imagery-provid
Python中类静态方法：@classmethod/@staticmethod详解和实战示例
在Python中，类方法(@classmethod)和静态方法(@staticmethod)是类作用域下的两种特殊方法。它们使用装饰器定义，并且与实例方法(deffunc(self))的行为有所不同。1.三种方法的对比概览方法类型是否访问实例(self)是否访问类(cls)典型用途实例方法✅是❌否访问对象属性类方法@classmethod❌否✅是创建类的替代构造器，访问类变量等静态方法@stati
枚举的构造函数中抛出异常会怎样 bylijinnan java enum 单例
首先从使用enum实现单例说起。为什么要用enum来实现单例？这篇文章（ http://javarevisited.blogspot.sg/2012/07/why-enum-singleton-are-better-in-java.html）阐述了三个理由： 1.enum单例简单、容易，只需几行代码： public enum Singleton { INSTANCE;
CMake 教程 aigo C++
转自：http://xiang.lf.blog.163.com/blog/static/127733322201481114456136/ CMake是一个跨平台的程序构建工具，比如起自己编写Makefile方便很多。介绍：http://baike.baidu.com/view/1126160.htm 本文件不介绍CMake的基本语法，下面是篇不错的入门教程： http:
cvc-complex-type.2.3: Element 'beans' cannot have character Cb123456 spring Webgis
cvc-complex-type.2.3: Element 'beans' cannot have character Line 33 in XML document from ServletContext resource [/WEB-INF/backend-servlet.xml] is i
jquery实例:随页面滚动条滚动而自动加载内容 120153216 jquery
<script language="javascript"> $(function (){ var i = 4;$(window).bind("scroll", function (event){ //滚动条到网页头部的高度，兼容ie,ff,chrome var top = document.documentElement.s
将数据库中的数据转换成dbs文件何必如此 sql dbs
旗正规则引擎通过数据库配置器（DataBuilder）来管理数据库，无论是Oracle，还是其他主流的数据都支持，操作方式是一样的。旗正规则引擎的数据库配置器是用于编辑数据库结构信息以及管理数据库表数据，并且可以执行SQL 语句，主要功能如下。 1)数据库生成表结构信息：主要生成数据库配置文件(.conf文
在IBATIS中配置SQL语句的IN方式 357029540 ibatis
在使用IBATIS进行SQL语句配置查询时，我们一定会遇到通过IN查询的地方，在使用IN查询时我们可以有两种方式进行配置参数：String和List。具体使用方式如下： 1.String:定义一个String的参数userIds，把这个参数传入IBATIS的sql配置文件，sql语句就可以这样写： <select id="getForms" param
Spring3 MVC 笔记（一） 7454103 spring mvc bean REST JSF
自从 MVC 这个概念提出来之后 struts1.X struts2.X jsf 。。。。。这个view 层的技术一个接一个！都用过！不敢说哪个绝对的强悍！要看业务，和整体的设计！最近公司要求开发个新系统！
Timer与Spring Quartz 定时执行程序 darkranger spring bean 工作 quartz
有时候需要定时触发某一项任务。其实在jdk1.3，java sdk就通过java.util.Timer提供相应的功能。一个简单的例子说明如何使用，很简单： 1、第一步，我们需要建立一项任务，我们的任务需要继承java.util.TimerTask package com.test; import java.text.SimpleDateFormat; import java.util.Date;
大端小端转换，le32_to_cpu 和cpu_to_le32 aijuans C语言相关
大端小端转换，le32_to_cpu 和cpu_to_le32 字节序 http://oss.org.cn/kernel-book/ldd3/ch11s04.html 小心不要假设字节序. PC 存储多字节值是低字节为先(小端为先, 因此是小端), 一些高级的平台以另一种方式(大端)
Nginx负载均衡配置实例详解 avords
[导读] 负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡，单从字面上的意思来理解就可以解负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡
乱说的 houxinyou 框架敏捷开发软件测试
从很久以前，大家就研究框架，开发方法，软件工程，好多！反正我是搞不明白！这两天看好多人研究敏捷模型，瀑布模型！也没太搞明白. 不过感觉和程序开发语言差不多，瀑布就是顺序，敏捷就是循环. 瀑布就是需求、分析、设计、编码、测试一步一步走下来。而敏捷就是按摸块或者说迭代做个循环，第个循环中也一样是需求、分析、设计、编码、测试一步一步走下来。也可以把软件开发理
欣赏的价值——一个小故事 bijian1013 有效辅导欣赏欣赏的价值
　　第一次参加家长会，幼儿园的老师说："您的儿子有多动症，在板凳上连三分钟都坐不了，你最好带他去医院看一看。"　　回家的路上，儿子问她老师都说了些什么，她鼻子一酸，差点流下泪来。因为全班30位小朋友，惟有他表现最差；惟有对他，老师表现出不屑，然而她还在告诉她的儿子："老师表扬你了，说宝宝原来在板凳上坐不了一分钟，现在能坐三分钟。其他妈妈都非常羡慕妈妈，因为全班只有宝宝
包冲突问题的解决方法 bingyingao eclipse maven exclusions 包冲突
包冲突是开发过程中很常见的问题：其表现有： 1.明明在eclipse中能够索引到某个类，运行时却报出找不到类。 2.明明在eclipse中能够索引到某个类的方法，运行时却报出找不到方法。 3.类及方法都有，以正确编译成了.class文件，在本机跑的好好的，发到测试或者正式环境就抛如下异常： java.lang.NoClassDefFoundError: Could not in
【Spark七十五】Spark Streaming整合Flume-NG三之接入log4j bit1129 Stream
先来一段废话：实际工作中，业务系统的日志基本上是使用Log4j写入到日志文件中的，问题的关键之处在于业务日志的格式混乱，这给对日志文件中的日志进行统计分析带来了极大的困难，或者说，基本上无法进行分析，每个人写日志的习惯不同，导致日志行的格式五花八门，最后只能通过grep来查找特定的关键词缩小范围，但是在集群环境下，每个机器去grep一遍，分析一遍，这个效率如何可想之二，大好光阴都浪费在这上面了
sudoku solver in Haskell bookjovi sudoku haskell
这几天没太多的事做，想着用函数式语言来写点实用的程序，像fib和prime之类的就不想提了（就一行代码的事），写什么程序呢？在网上闲逛时发现sudoku游戏，sudoku十几年前就知道了，学生生涯时也想过用C/Java来实现个智能求解，但到最后往往没写成，主要是用C/Java写的话会很麻烦。现在写程序，本人总是有一种思维惯性，总是想把程序写的更紧凑，更精致，代码行数最少，所以现
java apache ftpClient bro_feng java
最近使用apache的ftpclient插件实现ftp下载，遇见几个问题，做如下总结。 1. 上传阻塞，一连串的上传，其中一个就阻塞了，或是用storeFile上传时返回false。查了点资料，说是FTP有主动模式和被动模式。将传出模式修改为被动模式ftp.enterLocalPassiveMode();然后就好了。看了网上相关介绍，对主动模式和被动模式区别还是比较的模糊，不太了解被动模
读《研磨设计模式》-代码笔记-工厂方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 工厂方法模式：使一个类的实例化延迟到子类 * 某次，我在工作不知不觉中就用到了工厂方法模式（称为模板方法模式更恰当。2012-10-29）： * 有很多不同的产品，它
面试记录语 chenyu19891124 招聘
或许真的在一个平台上成长成什么样，都必须靠自己去努力。有了好的平台让自己展示，就该好好努力。今天是自己单独一次去面试别人，感觉有点小紧张，说话有点打结。在面试完后写面试情况表，下笔真的好难，尤其是要对面试人的情况说明真的好难。今天面试的是自己同事的同事，现在的这个同事要离职了，介绍了我现在这位同事以前的同事来面试。今天这位求职者面试的是配置管理，期初看了简历觉得应该很适合做配置管理，但是今天面
Fire Workflow 1.0正式版终于发布了 comsci 工作 workflow Google
Fire Workflow 是国内另外一款开源工作流，作者是著名的非也同志，哈哈.... 官方网站是 http://www.fireflow.org 经过大家努力,Fire Workflow 1.0正式版终于发布了正式版主要变化: 1、增加IWorkItem.jumpToEx(...)方法，取消了当前环节和目标环节必须在同一条执行线的限制，使得自由流更加自由 2、增加IT
Python向脚本传参 daizj python 脚本传参
如果想对python脚本传参数，python中对应的argc, argv(c语言的命令行参数)是什么呢？需要模块：sys 参数个数：len(sys.argv) 脚本名： sys.argv[0] 参数1： sys.argv[1] 参数2： sys.argv[
管理用户分组的命令gpasswd dongwei_6688 passwd
NAME： gpasswd - administer the /etc/group file SYNOPSIS： gpasswd group gpasswd -a user group gpasswd -d user group gpasswd -R group gpasswd -r group gpasswd [-A user,...] [-M user,...] g
郝斌老师数据结构课程笔记 dcj3sjt126com 数据结构与算法
<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
yii2 cgridview加上选择框进行操作 dcj3sjt126com GridView
页面代码 <?=Html::beginForm(['controller/bulk'],'post');?> <?=Html::dropDownList('action','',[''=>'Mark selected as: ','c'=>'Confirmed','nc'=>'No Confirmed'],['class'=>'dropdown',])
linux mysql fypop linux
enquiry mysql version in centos linux yum list installed | grep mysql yum -y remove mysql-libs.x86_64 enquiry mysql version in yum repositoryyum list | grep mysql oryum -y list mysql* install mysq
Scramble String hcx2013 String
Given a string s1, we may represent it as a binary tree by partitioning it to two non-empty substrings recursively. Below is one possible representation of s1 = "great":
跟我学Shiro目录贴 jinnianshilongnian 跟我学shiro
历经三个月左右时间，《跟我学Shiro》系列教程已经完结，暂时没有需要补充的内容，因此生成PDF版供大家下载。最近项目比较紧，没有时间解答一些疑问，暂时无法回复一些问题，很抱歉，不过可以加群（334194438/348194195）一起讨论问题。 ----广告-----------------------------------------------------
nginx日志切割并使用flume-ng收集日志 liyonghui160com
nginx的日志文件没有rotate功能。如果你不处理，日志文件将变得越来越大，还好我们可以写一个nginx日志切割脚本来自动切割日志文件。第一步就是重命名日志文件，不用担心重命名后nginx找不到日志文件而丢失日志。在你未重新打开原名字的日志文件前，nginx还是会向你重命名的文件写日志，linux是靠文件描述符而不是文件名定位文件。第二步向nginx主
Oracle死锁解决方法 pda158 oracle
　select p.spid,c.object_name,b.session_id,b.oracle_username,b.os_user_name from v$process p,v$session a, v$locked_object b,all_objects c where p.addr=a.paddr and a.process=b.process and c.object_id=b.
java之List排序 shiguanghui list排序
在Java Collection Framework中定义的List实现有Vector，ArrayList和LinkedList。这些集合提供了对对象组的索引访问。他们提供了元素的添加与删除支持。然而，它们并没有内置的元素排序支持。　　你能够使用java.util.Collections类中的sort()方法对List元素进行排序。你既可以给方法传递
servlet单例多线程 utopialxw 单例多线程 servlet
转自http://www.cnblogs.com/yjhrem/articles/3160864.html 和 http://blog.chinaunix.net/uid-7374279-id-3687149.html Servlet 单例多线程 Servlet如何处理多个请求访问？Servlet容器默认是采用单实例多线程的方式处理多个请求的：1.当web服务器启动的

Pandas read_csv读取文本文件速度测试

Pandas read_csv读取文本文件速度测试

问题发现

一、测试条件

1.测试环境

2.测试对象

二、测试程序

三、测试结果

1.Pandas1.0.3 read_csv读取文件

2.Pandas0.23.4 read_csv读取文件

3.Pandas0.24.1 read_csv读取文件

4.Pandas0.25.3 read_csv读取文件

总结和分析

1.测试总结

2.分析

你可能感兴趣的:(python,pandas,csv,测试类型)