MacOS 安装 Hadoop 3.3.4

MacOS 12.6 安装 Hadoop 3.3.4 单机版

下载

202210151420368

配置

  • 创建目录用来存放Hadoop
mkdir -p /Users/wangzengwei/Tools/hadoop-3.3.4
  • 解压缩下载好的Hadoop文件
cd /Users/wangzengwei/Tools/hadoop-3.3.4
tar -zxvf hadoop-3.3.4.tar.gz
  • 配置 hadoop-env.sh
export JAVA_HOME=/Library/Java/JavaVirtualMachines/jdk1.8.0_341.jdk/Contents/Home
export HADOOP_CONF_DIR=/Users/wangzengwei/Tools/hadoop-3.3.4/etc/hadoop
  • 配置 core-site.xml
<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
    <!--用来指定hadoop运行时产生文件的存放目录  自己创建-->
    <property>
        <name>hadoop.tmp.dir</name>
    <value>file:/Users/wangzengwei/Tools/hadoop-3.3.4/tmp</value>
    </property>
    <property>
        <name>fs.trash.interval</name>
        <value>1440</value>
    </property>
</configuration>
  • 配置 hdfs-site.xml
<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <!--不是root用户也可以写文件到hdfs-->
    <property>
        <name>dfs.permissions</name>
        <value>false</value>    <!--关闭防火墙-->
    </property>
    <!--把路径换成本地的name坐在位置-->
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>/Users/wangzengwei/Tools/hadoop-3.3.4/namenodedir</value>
    </property>
    <!--在本地新建一个存放hadoop数据的文件夹,然后将路径在这里配置一下-->
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>/Users/wangzengwei/Tools/hadoop-3.3.4/datanodedir</value>
    </property>
</configuration>
  • 配置 mapred-site.xml
<configuration>
    <property>
        <!--指定mapreduce运行在yarn上-->
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>
  • 配置 yarn-site.xml
<configuration>
    <!-- Site specific YARN configuration properties -->
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
    <property>
        <name>yarn.resourcemanager.address</name>
        <value>localhost:18040</value>
    </property>
    <property>
        <name>yarn.resourcemanager.scheduler.address</name>
        <value>localhost:18030</value>
    </property>
    <property>
        <name>yarn.resourcemanager.resource-tracker.address</name>
        <value>localhost:18025</value>
    </property>
    <property>
        <name>yarn.resourcemanager.admin.address</name>
        <value>localhost:18141</value>
    </property>
    <property>
        <name>yarn.resourcemanager.webapp.address</name>
        <value>localhost:18088</value>
    </property>
</configuration>
  • Hadoop namenode 格式化
hdfs namenode -format
  • 配置 ssh 免密登录
ssh-keygen -t rsa
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

# 验证ssh 
ssh localhost

启动

cd /Users/wangzengwei/Tools/hadoop-3.3.4/sbin
./start-all.sh

验证

终端执行 jps 命令,在打印结果中会看到 5 个进程,分别是 namenode、 secondarynamenode、datanode、resourcemanager、nodemanager,说明启动成功

202210151435969

202210151436113

停止

cd /Users/wangzengwei/Tools/hadoop-3.3.4/sbin
./stop-all.sh

本作品采用 知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议 (CC BY-NC-ND 4.0) 进行许可。