温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

如何使用Maven创建Hadoop2项目

发布时间:2021-08-18 11:40:47 来源:亿速云 阅读:144 作者:chen 栏目:云计算

本篇内容介绍了“如何使用Maven创建Hadoop2项目 ”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

使用Maven创建Hadoop2项目

    <dependencies>         <dependency>             <groupId>jdk.tools</groupId>             <artifactId>jdk.tools</artifactId>             <version>1.7</version>             <scope>system</scope>             <systemPath>Java_Home/lib/tools.jar</systemPath>         </dependency>         <dependency>             <groupId>org.apache.hadoop</groupId>             <artifactId>hadoop-common</artifactId>             <version>2.5.2</version>             <exclusions>                 <exclusion>                     <groupId>jdk.tools</groupId>                     <artifactId>jdk.tools</artifactId>                 </exclusion>             </exclusions>         </dependency>         <dependency>             <groupId>org.apache.hadoop</groupId>             <artifactId>hadoop-hdfs</artifactId>             <version>2.5.2</version>         </dependency>         <dependency>             <groupId>org.apache.hadoop</groupId>             <artifactId>hadoop-client</artifactId>             <version>2.5.2</version>         </dependency>     </dependencies>


连接到Hadoop2环境,例如: 

import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.IntWritable; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.lib.input.FileInputFormat; import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat; import org.apache.hadoop.mapreduce.Job; import org.apache.hadoop.conf.Configuration; public class IPStarter {     public static void main(String[] args)  throws Exception {         Configuration conf = new Configuration();         //连接到hadoop2集群调试         conf.set("fs.defaultFS","hdfs://localhost:9000");         conf.set("mapreduce.framework.name", "yarn");         conf.set("yarn.resourcemanager.address", "localhost:8032");         conf.set("yarn.resourcemanager.scheduler.address", "localhost:8030");         //conf.set("mapred.remote.os", "Linux");         Job job = new Job(conf, "JobName");         job.setJar("/home/grid/study/hadoopDev2/target/hadoopDev2-1.0-SNAPSHOT.jar"); //开发环境调试时使用         job.setMapperClass(IPMap.class);         job.setReducerClass(IPReduce.class);         job.setMapOutputKeyClass(Text.class);         job.setMapOutputValueClass(Text.class);         job.setOutputKeyClass(Text.class);         job.setOutputValueClass(IntWritable.class);         FileInputFormat.addInputPath(job, new Path("hdfs://localhost:9000/dev2/in/access.20120104.log"));         FileOutputFormat.setOutputPath(job, new Path("hdfs://localhost:9000/dev2/out/ip"));         System.exit(job.waitForCompletion(true) ? 0 : 1);     } }

PS:复制 HADOOP_HOME/etc/hadoop/log4j.properties 到程序的 src 目录下,这样调试时才能在控制台看到 Job 执行的详细日志 

“如何使用Maven创建Hadoop2项目 ”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注亿速云网站,小编将为大家输出更多高质量的实用文章!

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI