打印 pyspark.sql.dataframe.DataFrame 有哪些列

在 PySpark 中,要打印 pyspark.sql.dataframe.DataFrame 的列,可以使用 columns 属性。以下是一个示例代码:

from pyspark.sql import SparkSession

# 创建 SparkSession
spark = SparkSession.builder.getOrCreate()

# 假设您的 DataFrame 名称为 df
df = spark.createDataFrame([(1, 'John', 25), (2, 'Alice', 30), (3, 'Bob', 35)], ['id', 'name', 'age'])

# 打印 DataFrame 的列
columns = df.columns
print(columns)

运行上述代码将打印 DataFrame 的列名:

['id', 'name', 'age']

在上述示例中,我们创建了一个包含三列的 DataFrame (idname 和 age),然后使用 columns 属性获取列名,并将其打印出来。您可以将代码中的 DataFrame df 替换为您的实际 DataFrame 对象。

你可能感兴趣的:(pandas)