别拿Hadoop map key当id使
在写mapreduce时,发现一个问题:
hadoop的map函数的key一般是输入文件的行号,于是乎就希望把这个当作一个unique id来用,但是确出了很严重的问题,在分布式集群中,不同map任务中可能会有很多相同的行号,千万不能把这个key当作id.
相关推荐
  WeiHHH    2020-09-23  
   Aleks    2020-08-19  
   WeiHHH    2020-08-17  
   飞鸿踏雪0    2020-07-26  
   tomli    2020-07-26  
   deyu    2020-07-21  
   strongyoung    2020-07-19  
   eternityzzy    2020-07-19  
   Elmo    2020-07-19  
   飞鸿踏雪0    2020-07-09  
   飞鸿踏雪0    2020-07-04  
   xieting    2020-07-04  
   WeiHHH    2020-06-28  
   genshengxiao    2020-06-26  
   Hhanwen    2020-06-25  
 