码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • Sqoop实操案例-互联网招聘数据迁移


    🥇🥇【大数据学习记录篇】-持续更新中~🥇🥇


    个人主页:beixi@
    本文章收录于专栏(点击传送):【大数据学习】

    💓💓持续更新中,感谢各位前辈朋友们支持学习~💓💓

    上一篇文章写到了Sqoop的安装与验证,这篇文章接着上篇文章延伸Sqoop迁移数据的案例操作,如果Sqoop没有安装成功的小伙伴们可以参考我上一篇文章:大数据组件Sqoop-安装与验证
    在这里插入图片描述

    文章目录

      • 1.环境介绍
      • 2.启动hadoop环境
      • 3.互联网招聘数据迁移案例

    1.环境介绍

    本次用到的环境有:
    Oracle Linux 7.4
    Hadoop 2.7.4
    mysql
    sqoop

    2.启动hadoop环境

    1.打开命令窗口,启动HDFS平台。

    start-all.sh
    
    • 1

    在这里插入图片描述

    2.查看master上HDFS守护进程,注意:依据系统不同,实际显示可能与截图有出入,只要红色框中HDFS所示4个进程存在,即是正确

    jps
    
    • 1

    在这里插入图片描述

    3.互联网招聘数据迁移案例

    1.进入Linux命令窗口,登录mysql,我这里账号密码都是root

    mysql -uroot -proot
    
    • 1

    在这里插入图片描述

    2.构建源数据库

    create database job_db character set 'utf8' collate 'utf8_general_ci';
    
    • 1

    在这里插入图片描述

    3.查看数据库

    show databases;
    
    • 1

    在这里插入图片描述

    4.使用job_db数据库

    use job_db;
    
    • 1

    在这里插入图片描述

    5.原始job.sql文件存储在/root/experiment/datas/job/job.sql,将原始数据导入mysql,构建原始表数据

    source /root/experiment/datas/job/job.sql
    
    • 1

    在这里插入图片描述

    6.查看导入结果

    show tables;
    
    • 1

    在这里插入图片描述

    7.查看表数据

    select * from position;
    
    • 1

    在这里插入图片描述

    8.退出mysql窗口

    quit;
    
    • 1

    9. 进入sqoop根目录

    cd /opt/sqoop
    
    • 1

    在这里插入图片描述

    10.使用命令列出主机所有数据库

    bin/sqoop list-databases --connect jdbc:mysql://localhost:3306/ --username root --password root 
    
    • 1

    在这里插入图片描述

    11.用命令列出job_db数据库中所有的数据表

    bin/sqoop list-tables --connect jdbc:mysql://localhost:3306/job_db --username root --password root
    
    • 1

    在这里插入图片描述

    12.使用命令将数据库中的表导入到HDFS指定目录中

    bin/sqoop import  --connect jdbc:mysql://localhost:3306/job_db --username root --password root --delete-target-dir --table position  --target-dir /sqoop/position --m 1 
    
    • 1

    在这里插入图片描述
    在这里插入图片描述

    13.查看/sqoop目录下的文件

    hdfs dfs -ls -R /sqoop
    
    • 1

    在这里插入图片描述

    14.查看导入到HDFS的文件内容

    hdfs dfs -cat /sqoop/position/part-m-00000
    
    • 1

    在这里插入图片描述
    在这里插入图片描述

    15.再次将数据库中的表数据导入HDFS中,此次采用Tab制表格将字段进行分割

    bin/sqoop import  --connect jdbc:mysql://localhost:3306/job_db --username root --password root --delete-target-dir --table position  --target-dir /sqoop/position2 --m 1 --fields-terminated-by '\t' 
    
    • 1

    在这里插入图片描述
    在这里插入图片描述

    16.查看HDFS中sqoop目录下的内容

    hdfs dfs -ls -R /sqoop
    
    • 1

    在这里插入图片描述

    17.查看导入到HDFS的文件内容

    hdfs dfs -cat /sqoop/position2/part-m-00000
    
    • 1

    在这里插入图片描述
    在这里插入图片描述
    至此,互联网招聘数据迁移案例实验到到此结束,如果本篇文章对你有帮助记得点赞收藏+关注~

  • 相关阅读:
    android基础学习
    springboot全省中小学师生共建习题交流与指导平台毕业设计源码031619
    在湖北考一个安全员c3住建厅安全员c证持证上岗
    【3D 图像分割】基于 Pytorch 的 VNet 3D 图像分割5(训练篇)
    蓝牙Mesh系统开发五 ble mesh设备增加与移除
    什么是Vant? Spring Cloud Nacos注册中心
    spring+aliyunONS
    一站式数据采集物联网平台:智能化解决方案,让数据管理更高效、更安全
    前端框架的发展史
    什么是 doris,为什么几乎国内大厂都会使用它
  • 原文地址:https://blog.csdn.net/beixige/article/details/132628270
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号