pyspark dataframe vector转array 保存到csv文件 - 码农知识堂

pyspark dataframe vector转array 保存到csv文件
```
test_df.printSchema()
```
root
|-- features: vector (nullable = true)
|-- output: double (nullable = true)
|-- prediction: double (nullable = false)
```
vector_udf = F.udf(lambda vector: vector.toArray().tolist(), ArrayType(FloatType()))
flattened_df = test_df.withColumn('col1', vector_udf('features'))
 
flattened_df.printSchema()
```
root
|-- features: vector (nullable = true)
|-- output: double (nullable = true)
|-- prediction: double (nullable = false)
|-- col1: array (nullable = true)
| |-- element: float (containsNull = true)
```
list4tojson = ['col1']
#保存文件
flattened_df.select('output', *[F.to_json(x) for x in list4tojson]).coalesce(1).write.csv('test_001.csv')
 
save_df=flattened_df.select('output',"prediction", *[F.to_json(x) for x in list4tojson])
 
save_df.printSchema()
```
root
|-- output: double (nullable = true)
|-- prediction: double (nullable = false)
|-- to_json(col1): string (nullable = true)
相关阅读:
基于VC的WinSock网络编程实用宝典
 使用 Apache Camel 和 Quarkus 的微服务（三）
(五)Linux 4G模块封装发送指令函数以及检测串口和SIM卡是否就绪
 第05章_存储引擎
 用插入法对数组a进行降序排序。
k8s入门：kubernetes-dashboard 安装
 JNI的简单使用（Eclipse）
Git 分支管理策略汇总
 零基础入门Python基础知识全面梳理！从零开始成为编程高手
 劳保鞋批发，你找对地方了吗？
原文地址：https://blog.csdn.net/malingyu/article/details/133136530