split 函数在pyspark.sql 与hive中不同之处

pyspark.sql split 特殊字符 *

sql = """
            select 
             split(flag,"\\*") as flag
            from tableA
         """
 s = sqlContext.sql(sql).first()

hive 中执行上述sql 中正常运行
但是在pyspark 中失败
错误如下:
split 函数在pyspark.sql 与hive中不同之处_第1张图片

在网上查找到的解决方案 均是如下
在这里插入图片描述
但是在pyspark 无法运行成功,后来尝试使用如下写法得到解决

sql = """
            select 
             split(flag,"\\\\*") as flag
            from tableA
         """
 s = sqlContext.sql(sql).first()

原因是 在java 正则式中 在这里插入图片描述

你可能感兴趣的:(python,pyspark小知识卡片)