• HDFS系统操作命令大全


    1.前言

    HDFS作为分布式存储的文件系统,有其对数据的路径表达方式

    HDFS同linux系统一样,均是以/作为根目录的组织形式

    linux:/usr/local/hello.txt

    HDFS:/usr/local/hello.txt

    2.如何区分呢?

    Linux:file:///

    HDFS:hdfs://namenode:port/

    协议头file:///或hdfs://root1:8020/可以省略

    需要提供Linux路径的参数,会自动识别为file://

    需要提供HDFS路径的参数,会自动识别hdfs://

    除非明确需要写或不写会有BUG,否则一般不用写协议头

    3.介绍

    关于HDFS文件系统的操作命令,Hadoop提供了2套命令体系

    hadoop命令(老版本),用法:hadoop fs [generic options]

    hdfs命令(新版本用法),用法:hdfs dfs [generic options]

    两者在文件系统操作上,用法完全一致

    用哪个都可以

    某些特殊操作需要选择hadoop命令或hdfs命令

    3.1 创建文件夹

    hadoop fs -mkdir [-p] ….

    hdfs dfs -mkdir [-p]   ….

    path为待创建的目录

    -p选择的行为与linux mkdir -p一致,它会沿着路径创建父目录

    3.2 查看指定目录下内容

    hadoop fs -ls [-h] [-R] […]

    hdfs dfs -ls [-h] [-R] […]

    path指定目录路径

    -h人性化显示文件size(大小)

    -R递归查看指定目录以及子目录

    3.3 上传文件到HDFS指定目录下

    hadoop fs -put [-f] [-p]

    hdfs dfs -put [-f] [-p]

    -f 覆盖目标文件(以存在下)

    -p 保留访问和修改时间,所有权和权限

    localsrc本地文件系统(客户端所在机器)

    dst 目标文件系统(HDFS)

    例子:

    hadoop fs -put word.txt /root

    hdfs dfs -put file:///etc/profile hdfs://root1:8020/root

    3.4 查看HDFS文件内容

    hadoop fs -cat

    hdfs dfs -cat

    读取指定文件全部内容,显示在标准输出控制台

    hadoop fs -cat /root/1.txt

    hdfs dfs -cat /root/2.txt

    读取大文件可以使用管道符配合more(配合grep过滤非常好用)

    hadoop fs -cat | more

    hdfs dfs -cat | more

    3.5 下载HDFS文件

    hadoop fs -get [-f] [-p]

    hdfs dfs -get [-f] [-p]

    下载文件到本地文件系统指定目录,localdst必须是目录

    -f 覆盖目标文件(已存在下)

    -p 保留访问和修改时间,所有权和权限

    3.6 拷贝HDFS文件

    hadoop fs -cp [-f]

    hdfs dfs -cp [-f]

    -f 覆盖目标文件(已存在下)

    3.7 追加数据到HDFS文件中

    hadoop fs -appenToFile

    hdfs dfs -appendToFile

    将所有给定本地文件的内容追加到给定dst文件

    dst如果文件不存在,将创建该文件

    如果为-,则输入为从标准输入中读取

    3.8 HDFS数据移动操作

    hadoop fs -mv

    hdfs dfs -mv

    移动文件到指定文件夹下

    可以使用命令移动数据

    3.9 HDFS数据删除操作

    hadoop fs -rm -r [-skipTrash] URl [URl …]

    hdfs dfs -rm -r [-skipTrash] URl [URl …]

    删除指定路径的文件或文件夹

    -skipTrash跳过回收站,直接删除

    4.HDFS shell其他命令

    命令官方指导文档

    Apache Hadoop 3.3.4 – Overview

    5.HDFS web浏览

    除了使用命令操作HDFS文件系统外,在HDFS的web UI上也可以查看HDFS文件系统的内容

  • 相关阅读:
    安装配置 zookeeper(单机版)
    表格拖拽和可编辑行功能
    python入门(一)
    如何使用Docker安装Kibana
    PyTorch学习笔记-损失函数与反向传播
    计算机竞赛 深度学习人体跌倒检测 -yolo 机器视觉 opencv python
    Logback 相关组件
    nginx $uri导致的CRLF注入漏洞
    【机器学习概念笔记】:空间概念
    如何使用固态硬盘+硬盘盒子+U盘创造移动双系统
  • 原文地址:https://blog.csdn.net/hexiaan/article/details/134254757