一文教你在 Windows 上安装 Hadoop
前期准备
在 Windows 上安装 Hadoop,首先咱们得准备好一些必要的东西。像 Java 环境就是必须要有的,因为 Hadoop 是基于 Java 开发的。得先去官网下载适合你系统的 JDK 安装包,安装的时候记得配置好环境变量,这样系统才能找到 Java 程序。
 
还有就是 Hadoop 安装包,去 Apache Hadoop 的官方网站下载稳定版本,下载完解压到你指定的文件夹,比如说 C:hadoop。
配置环境变量
这一步很关键。咱们要在系统的环境变量里添加 Hadoop 相关的路径。先新建一个 HADOOP_HOME 变量,值就是你解压 Hadoop 的路径,像刚才说的 C:hadoop。然后在 Path 变量里追加 %HADOOP_HOME%bin 和 %HADOOP_HOME%sbin,这样系统就能在任何位置找到 Hadoop 的可执行文件了。
配置 Hadoop 文件
- 
core – site.xml:这个文件主要是配置 Hadoop 的核心参数。打开在 Hadoop 安装目录下的 etchadoopcore - site.xml文件,在<configuration>标签里添加下面这段内容:<property> <name>fs.defaultFS</name> <value>hdfs://localhost:9000</value> </property> <property> <name>hadoop.tmp.dir</name> <value>C:hadooptmp</value> </property>这里设置了默认的文件系统和临时目录。 
- 
hdfs – site.xml:这个文件用于配置 HDFS 的相关参数。同样在 etchadoop目录下找到hdfs - site.xml,在<configuration>标签里添加:<property> <name>dfs.replication</name> <value>1</value> </property> <property> <name>dfs.namenode.name.dir</name> <value>C:hadoopdfsnamenode</value> </property> <property> <name>dfs.datanode.data.dir</name> <value>C:hadoopdfsdatanode</value> </property>这里设置了数据副本数量,以及 NameNode 和 DataNode 的存储目录。 
- 
mapred – site.xml:这个文件是配置 MapReduce 相关参数的。先把 etchadoop目录下的mapred - site.xml.template复制一份,重命名为mapred - site.xml,然后打开在<configuration>标签里添加:<property> <name>mapreduce.framework.name</name> <value>yarn</value> </property>表示使用 YARN 作为 MapReduce 的框架。 
- 
yarn – site.xml:用于配置 YARN 的相关参数。在 etchadoop目录下找到yarn - site.xml,在<configuration>标签里添加:<property> <name>yarn.nodemanager.aux - services</name> <value>mapreduce_shuffle</value> </property> <property> <name>yarn.resourcemanager.hostname</name> <value>localhost</value> </property>这里配置了 NodeManager 的辅助服务和 ResourceManager 的主机名。 
解决 Windows 下的兼容性问题
Hadoop 原本是为 Linux 设计的,在 Windows 下运行有些地方得处理一下。咱们需要下载 winutils.exe 文件,把它放到 HADOOP_HOMEbin 目录下。
启动 Hadoop
一切准备好后,就可以启动 Hadoop 了。以管理员身份打开命令提示符,先格式化 NameNode,输入 hdfs namenode -format。格式化完成后,启动 Hadoop 相关服务,输入 start - all.cmd。如果启动过程没有报错,就可以通过浏览器访问 http://localhost:50070 查看 HDFS 的 Web 界面,访问 http://localhost:8088 查看 YARN 的 Web 界面。
这样,Hadoop 在 Windows 上就安装成功啦,你可以开始用它进行大数据处理相关的学习和实践咯。















暂无评论内容