打印 pyspark.sql.dataframe.DataFrame 有哪些列 - 码农知识堂

打印 pyspark.sql.dataframe.DataFrame 有哪些列
在 PySpark 中，要打印 pyspark.sql.dataframe.DataFrame 的列，可以使用 columns 属性。以下是一个示例代码：
```
from pyspark.sql import SparkSession
 
# 创建 SparkSession
spark = SparkSession.builder.getOrCreate()
 
# 假设您的 DataFrame 名称为 df
df = spark.createDataFrame([(1, 'John', 25), (2, 'Alice', 30), (3, 'Bob', 35)], ['id', 'name', 'age'])
 
# 打印 DataFrame 的列
columns = df.columns
print(columns)
```
运行上述代码将打印 DataFrame 的列名：
```
['id', 'name', 'age']
```
在上述示例中，我们创建了一个包含三列的 DataFrame (id、name 和 age)，然后使用 columns 属性获取列名，并将其打印出来。您可以将代码中的 DataFrame df 替换为您的实际 DataFrame 对象。
相关阅读:
视频批量AI智剪：提升剪辑效率的秘密方法
 mysql连接不上可能的原因：防火墙放行mysql的3306端口全库复制：data目录替换即可 mysql查看版本
 JVM——10.对象的内存布局
 均薪36W还缺人，DFT工程师到底有多重要?
Abbexa丨Abbexa低样本量人血小板生成素ELISA试剂盒
 springboot 中如何正确的在异步线程中使用request
uniapp中videojs、renderjs的使用
 【linux】进程控制——1
【数据架构】数据网格与 Data Fabric：了解差异
 通过conda创建纯净Python环境
原文地址：https://blog.csdn.net/jp_666/article/details/133077681