接上一篇--使用python,将excel数据批量导入数据库

  • 这是上一篇文章的优化版本,相较于一条一条的执行sql语句,本文中,将excel中所有的数据先写到list列表中
  • 在通过函数

    ?

    1

    cursor.executemany(sql, list

    一次性写入到数据库中
  • ?

    1

    2

    3

    4

    5

    6

    7

    8

    9

    10

    11

    12

    13

    14

    15

    16

    17

    18

    19

    20

    21

    22

    23

    24

    25

    26

    27

    28

    29

    30

    31

    32

    33

    34

    35

    36

    37

    38

    39

    40

    41

    42

    43

    44

    45

    46

    47

    48

    49

    50

    51

    52

    53

    54

    55

    56

    57

    58

    59

    60

    61

    62

    63

    64

    65

    66

    67

    68

    69

    70

    71

    import pymysql

    import xlrd

     

     

    '''

        连接数据库

        args:db_name(数据库名称)

        returns:db

         

    '''

    def mysql_link(de_name):

        try:

            db = pymysql.connect(host="127.0.0.1", user="root",

                                 passwd="XXX",

                                 db=de_name,

                                 charset='utf8')

            return db

        except:

            print("could not connect to mysql server")

     

     

    '''

        读取excel函数

        args:excel_file(excel文件,目录在py文件同目录)

        returns:book

    '''

    def open_excel(excel_file):

        try:

            book = xlrd.open_workbook(excel_file)  #文件名,把文件与py文件放在同一目录下

            return book

        except:

            print("open excel file failed!")

     

     

    '''

        执行插入操作

        args:db_name(数据库名称)

             table_name(表名称)

             excel_file(excel文件名,把文件与py文件放在同一目录下)

              

    '''

    def store_to(db_name,table_name,excel_file):

        db = mysql_link(db_name)  # 打开数据库连接

        cursor = db.cursor()  # 使用 cursor() 方法创建一个游标对象 cursor

     

        book = open_excel(excel_file)   # 打开excel文件

        sheets = book.sheet_names()   # 获取所有sheet表名

        for sheet in sheets:

            sh = book.sheet_by_name(sheet)   # 打开每一张表

            row_num = sh.nrows

            print(row_num)

            list = []   # 定义列表用来存放数据

            for i in range(1, row_num):  # 第一行是标题名,对应表中的字段名所以应该从第二行开始,计算机以0开始计数,所以值是1

                row_data = sh.row_values(i)  # 按行获取excel的值

                value = (row_data[0], row_data[1],row_data[2],row_data[3],row_data[4],row_data[5],\

                         row_data[6],row_data[7],row_data[8],row_data[9],row_data[10],row_data[11],row_data[12],row_data[13],row_data[14])

                list.append(value)  # 将数据暂存在列表

                # print(i)

            sql = "INSERT INTO "+ table_name + " ( bj_shijian,bjr_xingbie,anfa_didian,\

                zb_x,zb_y,bj_chongfu,jiejing_lb_name,baojing_lb_name,baojing_lx_name,baojing_lx_xl_name,\

                guanxia_qy_name,guanxian_dw_name,anfa_qulu,anfa_xiaoqu,chujing_dw_name)VALUES(%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s)"

            cursor.executemany(sql, list# 执行sql语句

            db.commit()  # 提交

            list.clear()  # 清空list

            print("worksheets: " + sheet + " has been inserted " + str(row_num) + " datas!")

        cursor.close()  # 关闭连接

        db.close()

     

     

    if __name__ == '__main__':

        store_to('demo','demo_yangben','qh.xlsx')

      可以选择传入的数据库,及数据库表名,excel文件名(excel文件和py文件同目录,否则加上路径)

  •  
  •  每一万条写入一次
  • ?

    1

    2

    3

    4

    5

    6

    7

    8

    9

    10

    11

    12

    13

    14

    15

    16

    17

    18

    19

    20

    21

    22

    23

    24

    25

    26

    27

    28

    29

    30

    31

    32

    33

    34

    35

    36

    37

    38

    39

    40

    41

    42

    43

    44

    45

    46

    47

    48

    49

    50

    51

    52

    53

    54

    55

    56

    57

    58

    59

    60

    61

    62

    63

    64

    65

    66

    67

    68

    69

    70

    71

    72

    73

    74

    75

    76

    77

    78

    79

    80

    81

    82

    83

    84

    85

    86

    import pymysql

    import xlrd

    import sys

     

    '''

        连接数据库

        args:db_name(数据库名称)

        returns:db

     

    '''

     

     

    def mysql_link(de_name):

        try:

            db = pymysql.connect(host="127.0.0.1", user="root",

                                 passwd="a12345",

                                 db=de_name,

                                 charset='utf8')

            return db

        except:

            print("could not connect to mysql server")

     

     

    '''

        读取excel函数

        args:excel_file(excel文件,目录在py文件同目录)

        returns:book

    '''

     

     

    def open_excel(excel_file):

        try:

            book = xlrd.open_workbook(excel_file)  # 文件名,把文件与py文件放在同一目录下

            print(sys.getsizeof(book))

            return book

        except:

            print("open excel file failed!")

     

     

    '''

        执行插入操作

        args:db_name(数据库名称)

             table_name(表名称)

             excel_file(excel文件名,把文件与py文件放在同一目录下)

     

    '''

     

     

    def store_to(db_name, table_name, excel_file):

        db = mysql_link(db_name)  # 打开数据库连接

        cursor = db.cursor()  # 使用 cursor() 方法创建一个游标对象 cursor

     

        book = open_excel(excel_file)  # 打开excel文件

        sheets = book.sheet_names()  # 获取所有sheet表名

        for sheet in sheets:

            sh = book.sheet_by_name(sheet)  # 打开每一张表

            row_num = sh.nrows

            print(row_num)

            list = []  # 定义列表用来存放数据

            num = 0  # 用来控制每次插入的数量

            for i in range(1, row_num):  # 第一行是标题名,对应表中的字段名所以应该从第二行开始,计算机以0开始计数,所以值是1

                row_data = sh.row_values(i)  # 按行获取excel的值

                value = (row_data[0], row_data[1], row_data[2], row_data[3], row_data[4], row_data[5], \

                         row_data[6], row_data[7], row_data[8], row_data[9], row_data[10], row_data[11], row_data[12],

                         row_data[13], row_data[14])

                list.append(value)  # 将数据暂存在列表

                num += 1

                if( num>= 10000 ):  # 每一万条数据执行一次插入

                    print(sys.getsizeof(list))

                    sql = "INSERT INTO " + table_name + " (time, xingbie, afdd, xzb, yzb, cfbj, jjlbmc, \

                    bjlbmc, bjlxmc, bjlxxlmc, gxqymc,gxdwmc, afql, afxqxx, cjdwmc)\

                    VALUES(%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s)"

                    cursor.executemany(sql, list# 执行sql语句

     

                    num = 0  # 计数归零

                    list.clear()  # 清空list

                    print("worksheets: " + sheet + " has been inserted 10000 datas!")

                     

        print("worksheets: " + sheet + " has been inserted " + str(row_num) + " datas!")

        db.commit()  # 提交

        cursor.close()  # 关闭连接

        db.close()

     

     

    if __name__ == '__main__':

        store_to('demo', 'demo_yangben', 'qh.xlsx')

      sys.getsizeof()方法监测内存占用

你可能感兴趣的:(接上一篇--使用python,将excel数据批量导入数据库)