淘宝双11数据分析与预测--“坑点”汇总

国庆假期留在学校做了一下林子雨博士的大数据实验--淘宝双11数据分析与预测,虽然教程写得很详细,但自己还是踩了很多坑,现在记录下来,希望给别人一点帮助。

淘宝双11数据分析与预测实验连接:点击这里

  • 问题一:安装Hadoop时报错

报错内容:

Starting namenodes on [localhost]
localhost: mkdir: 无法创建目录"/usr/local/hadoop/logs": 权限不够
localhost: chown: 无法访问"/usr/local/hadoop/logs": 没有那个文件或目录
localhost: starting namenode, logging to /usr/local/hadoop/logs/hadoop-dblab-namenode-dblab-virtual-machine.out
localhost: /usr/local/hadoop/sbin/hadoop-daemon.sh: 行 159: /usr/local/hadoop/logs/hadoop-dblab-namenode-dblab-virtual-machine.out: 没有那个文件或目录
localhost: head: 无法打开"/usr/local/hadoop/logs/hadoop-dblab-namenode-dblab-virtual-machine.out" 读取数据: 没有那个文件或目录
localhost: /usr/local/hadoop/sbin/hadoop-daemon.sh: 行 177: /usr/local/hadoop/logs/hadoop-dblab-namenode-dblab-virtual-machine.out: 没有那个文件或目录
localhost: /usr/local/hadoop/sbin/hadoop-daemon.sh: 行 178: /usr/local/hadoop/logs/hadoop-dblab-namenode-dblab-virtual-machine.out: 没有那个文件或目录
localhost: mkdir: 无法创建目录"/usr/local/hadoop/logs": 权限不够
localhost: chown: 无法访问"/usr/local/hadoop/logs": 没有那个文件或目录
localhost: starting datanode, logging to /usr/local/hadoop/logs/hadoop-dblab-datanode-dblab-virtual-machine.out
localhost: /usr/local/hadoop/sbin/hadoop-daemon.sh: 行 159: /usr/local/hadoop/logs/hadoop-dblab-datanode-dblab-virtual-machine.out: 没有那个文件或目录
localhost: head: 无法打开"/usr/local/hadoop/logs/hadoop-dblab-datanode-dblab-virtual-machine.out" 读取数据: 没有那个文件或目录
localhost: /usr/local/hadoop/sbin/hadoop-daemon.sh: 行 177: /usr/local/hadoop/logs/hadoop-dblab-datanode-dblab-virtual-machine.out: 没有那个文件或目录
localhost: /usr/local/hadoop/sbin/hadoop-daemon.sh: 行 178: /usr/local/hadoop/logs/hadoop-dblab-datanode-dblab-virtual-machine.out: 没有那个文件或目录
Starting secondary namenodes [0.0.0.0]
0.0.0.0: mkdir: 无法创建目录"/usr/local/hadoop/logs": 权限不够
0.0.0.0: chown: 无法访问"/usr/local/hadoop/logs": 没有那个文件或目录
0.0.0.0: starting secondarynamenode, logging to /usr/local/hadoop/logs/hadoop-dblab-secondarynamenode-dblab-virtual-machine.out
0.0.0.0: /usr/local/hadoop/sbin/hadoop-daemon.sh: 行 159: /usr/local/hadoop/logs/hadoop-dblab-secondarynamenode-dblab-virtual-machine.out: 没有那个文件或目录
0.0.0.0: head: 无法打开"/usr/local/hadoop/logs/hadoop-dblab-secondarynamenode-dblab-virtual-machine.out" 读取数据: 没有那个文件或目录
0.0.0.0: /usr/local/hadoop/sbin/hadoop-daemon.sh: 行 177: /usr/local/hadoop/logs/hadoop-dblab-secondarynamenode-dblab-virtual-machine.out: 没有那个文件或目录
0.0.0.0: /usr/local/hadoop/sbin/hadoop-daemon.sh: 行 178: /usr/local/hadoop/logs/hadoop-dblab-secondarynamenode-dblab-virtual-machine.out: 没有那个文件或目录
dblab@dblab-virtual-machine:/usr/local/hadoop$ sudo chown -R niugen /usr/local/hadoop

报错原因:权限不够

解决方法:

sudo chown -R 你自己电脑到用户名  /usr/local/hadoop
  • 问题二:Error: JAVA_HOME is not set and could not be found.

解决方法: JAVA_HOME 环境变量没设置好,请按教程在.bashrc文件中设置好JAVA_HOME,如果
还是出现 Error: JAVA_HOME is not set and could not be found. 的错误,就到hadoop的安装目录修改配置文件“/usr/local/hadoop/etc/hadoop/hadoop-env.sh”,在里面找到“export JAVA_HOME=${JAVA_HOME}”这行,然后,把它修改成JAVA安装路径的具体地址,比如,
“export JAVA_HOME=/usr/lib/jvm/你自己到java版本”,然后,再次启动Hadoop。

  • 问题三:使用Sqoop将Hive数据导入到MySQL中

报错内容:

ERROR manager.SqlManager: Error executing statement: java.sql.SQLException: Access denied for user 'root'@'localhost' (using password: YES)
...
ERROR tool.ExportTool: Encountered IOException running export job: java.io.IOException: No columns to generate for ClassWriter

报错原因:操作权限不够
解决方法:
首先用命令service mysql start确保mysql已经启动,进入操作界面 mysql -u root -p,按提示输入的mysql密码,然后执行下面命令修改远程登录权限

mysql> grant all privileges on *.* to root@localhost identified by 'root';
Query OK, 0 rows affected, 1 warning (0.00 sec)

mysql> flush privileges;
Query OK, 0 rows affected (0.04 sec)
  • 问题四:将Hive数据导入到MySQL时报错

报错内容:

ERROR:"Unable to instantiate org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient"

报错原因:换数据库时没有和hive成功通信。
解决方法:在确保Hive和MySQL配置步骤正确执行的前提下,在终端输入如下命令

source /usr/local/hive/scripts/metastore/upgrade/mysql/hive-schema-3.0.0.mysql.sql//使这个版本的配置文件有用!注意更换文件路径 

schematool -dbType mysql -initSchema//进行初始化.运行显示成功就可以正常通信了。
  • 问题五:新建Java Web项目时,没有找到Dynamic Web Project

问题原因:安装的是专门开发java项目的,而Dynamic Web Project属于J2EE技术,所以你要专门下载一个集成了J2EE插件的Eclipse,(eclipse-jee-helios-SR2-win32)
解决方法:
方法一:先卸载之前的eclipse版本,到eclipse官网下载相对应版本的IDE
官网安装链接:点击这里

方法二:查看博客点击这里如果你在原来的eclipse版本下执行这个方法不成功,请转到方法一

  • 问题六:Eclipse导入外部的jar包

ps:与其说这是一个问题,不如说这是一个注意项。之前天真以为导入jar包只要鼠标左键拖拉进去就可以,其实这种做法是错误的。

正确操作步骤:查看此链接

相关推荐