python一切database
python连接dataphin中的hive库,主要涉及:presto-python-client依赖包。
#加载第三方库
import prestodb
import pandas as pd
#建立连接所需参数:schema为库名
conn = prestodb.dbapi.connect(host='',port=xxxx,catalog='hive',user='',schema='',http_schema='')
cur = conn.cursor()
sql = " "
cur.execute(sql)
rows = cur.fetchall()
df = pd.DataFrame(rows) #转换为dataframe格式
完成数据库的连接,可以进行分析和建模了~
ps:久违的更新,没想到转到产品岗后还有机会再coding;从算法转到产品,感觉思路会更加开阔一些,未来要继续加油呀~