pyspark连接mysql读取数据以及遇到的 No suitable driver的解决方法

由于对pyspark 的好奇以及追求,习惯了Python 的pandas 之后,想试试pyspark 。开始了艰难的pyspark之旅。

1、数据库的连接

pyspark 连接数据库

import findspark
#初始化
findspark.init()
import warnings
warnings.filterwarnings('ignore')
from pyspark.sql import SparkSession
# 定义数据库的地址,以及表,登录用户及密码
url = "jdbc:mysql://localhost:3306/xxx"
table="table_name"
#密码账户需要字典的形式传入
properties ={"user":"root","password":"123456"}
spark = SparkSession.builder.appName('My first app').getOrCreate()
df = spark.read.jdbc(url=url,table=table,properties=properties)
df.show()

运行无误。
pyspark连接mysql读取数据以及遇到的 No suitable driver的解决方法_第1张图片

2、错误解决

第一次接触pyspark ,连接数据库就出现java.sql.SQLException: No suitable driver这个错误,有点让人恼火。言归正传,产生改错误的原因是缺少连接mysql 连接java 的驱动。
1.下载mysql-connector-java-5.1.48驱动,将该驱动放入两个地方,一个是Java安装目录下的.\jre\lib\etc\文件夹中,一个是spark 的安装目录,/jars/文件夹下。
2、重新执行代码。看运行结果,如果依旧显示No stuitable driver ,重启一次电脑试试!

这是我安装是的解决方法,有什么不多的地方,请大家多多指教!

3、 附件

下附mysql 连接java 的驱动的下载地址:
链接:https://pan.baidu.com/s/1k1C9Uw_3aq6W2H_zXfVoEg
提取码:wajo

你可能感兴趣的:(pyspark连接mysql读取数据以及遇到的 No suitable driver的解决方法)