• pyspark连接mysql数据库报错


    使用pyspark连接mysql数据库代码如下

    1. spark_conf = SparkConf().setAppName("MyApp").setMaster("local")
    2. spark = SparkSession.builder.config(conf=spark_conf).getOrCreate()
    3. url = "jdbc:mysql://localhost:3306/test?useUnicode=true&characterEncoding=UTF-8&useSSL=false"
    4. table_name = "tab_tf"
    5. properties = {
    6. "user": "root",
    7. "password": "root"
    8. }
    9. # 读取 MySQL 数据库中的数据
    10. df = spark.read.jdbc(url=url, table=table_name, properties=properties)
    11. # 展示数据
    12. df.show()

    执行时报错了,错误信息如下:

    py4j.protocol.Py4JJavaError: An error occurred while calling o32.jdbc.
    : java.sql.SQLException: No suitable driver
        at java.sql.DriverManager.getDriver(DriverManager.java:315)
        at org.apache.spark.sql.execution.datasources.jdbc.JDBCOptionsanonfun$6.apply(JDBCOptions.scala:105)atorg.apache.spark.sql.execution.datasources.jdbc.JDBCOptions

    anonfun$6.apply(JDBCOptions.scala:105)
        at scala.Option.getOrElse(Option.scala:121)
        at org.apache.spark.sql.execution.datasources.jdbc.JDBCOptions.(JDBCOptions.scala:104)
        at org.apache.spark.sql.execution.datasources.jdbc.JDBCOptions.(JDBCOptions.scala:35)
        at org.apache.spark.sql.execution.datasources.jdbc.JdbcRelationProvider.createRelation(JdbcRelationProvider.scala:32)
        at org.apache.spark.sql.execution.datasources.DataSource.resolveRelation(DataSource.scala:332)
        at org.apache.spark.sql.DataFrameReader.loadV1Source(DataFrameReader.scala:242)
        at org.apache.spark.sql.DataFrameReader.load(DataFrameReader.scala:230)
        at org.apache.spark.sql.DataFrameReader.load(DataFrameReader.scala:186)
        at org.apache.spark.sql.DataFrameReader.jdbc(DataFrameReader.scala:257)
        at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
        at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
        at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
        at java.lang.reflect.Method.invoke(Method.java:498)
        at py4j.reflection.MethodInvoker.invoke(MethodInvoker.java:244)
        at py4j.reflection.ReflectionEngine.invoke(ReflectionEngine.java:357)
        at py4j.Gateway.invoke(Gateway.java:282)
        at py4j.commands.AbstractCommand.invokeMethod(AbstractCommand.java:132)
        at py4j.commands.CallCommand.execute(CallCommand.java:79)
        at py4j.GatewayConnection.run(GatewayConnection.java:238)
        at java.lang.Thread.run(Thread.java:748)
     

    经查询,是因为spark中缺少连接MySQL的驱动程序,于是乎下载了与自己mysql数据库版本一致的jar包,下载地址:https://downloads.mysql.com/archives/c-j/ 

    查询mysql版本命令:mysql -V

    下载完成后,解压,将mysql-connector-java-8.0.30.jar拷贝到spark安装目录的libs中

    重新执行程序,问题解决,执行结果如下:

    参考:py4j.protocol.Py4JJavaError: An error occurred while calling o32.jdbc.-CSDN博客

  • 相关阅读:
    流媒体协议初探(MPEG2-TS、RTSP、RTP、RTCP、SDP、RTMP、HLS、HDS、HSS、MPEG-DASH)
    Android Studio下载安装
    Vue学习—基本语法
    678. 有效的括号字符串
    AI绘图Stable Diffusion中关键技术:U-Net的应用
    SSH命令详解
    【OpenCV 例程200篇】228. 特征描述之 extendLBP 改进算子
    新东方的六级词汇词根 联想记忆法
    Nginx的块、变量以及重定向
    Python人员信息管理系统(简直期末人福音)
  • 原文地址:https://blog.csdn.net/Flychuer/article/details/134242489