spark学习笔记-java调用spark简单demo

摘要:
开发环境:win10+idea+jdk1.8+scala22.12.4具体步骤:编写scala测试类对象MyTest{defmain(args:Array[String]):Unit={valconf=newSparkConf()conf.setAppName(“MyTest”)conf.setMaster(“local”)valsc=newSparkContext(conf)valnpu

开发环境:

        win10+idea+jdk1.8+scala2.12.4

具体步骤:

  1. 编写scala测试类
    object MyTest {
      def main(args: Array[String]): Unit = {
        val conf = new SparkConf()
        conf.setAppName("MyTest")
        conf.setMaster("local")
        val sc = new SparkContext(conf)
        val input = sc.textFile("file:///F:/sparktest/catalina.out")
        val count = input.filter(_.contains("java.lang.NullPointerException")).count
        System.out.println("空指针异常数" + count)
        sc.stop()
      }
    }
    
  2. 设置工程输出路径spark学习笔记-java调用spark简单demo第1张
  3. 打jar包设置spark学习笔记-java调用spark简单demo第2张
  4. java编写调用类(需要依赖saprk包,可以将所有相关的包都加到lib依赖)
    public class SubmitScalaJobToSpark {
        public static void main(String[] args) {
            String[] arg0 = new String[]{
                    "--master", "spark://node101:7077",
                    "--deploy-mode", "client",
                    "--name", "test java submit job to spark",
                    "--class", "MyTest",//指定spark任务执行函数所在类
                    "--executor-memory", "1G",//运行内存
                    "E:\其他代码仓库\spark\out\artifacts\unnamed\unnamed.jar",//jar包路径
    
            };
    
            SparkSubmit.main(arg0);
        }
    }
    
  5. 运行测试

             spark学习笔记-java调用spark简单demo第3张

             

    

免责声明:文章转载自《spark学习笔记-java调用spark简单demo》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇robotframework-ride添加日志与报告路径前端动态生成二维码后合成海报,下载分享下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

前缀树及C++实现

文章   目录     1、什么是Trie树     2、树的构建与查询     3、Trie树的应用     4、C++实现Trie树以及解决一些字符串问题 前缀树 1 什么是Trie树   Trie树,即前缀树,又称单词查找树,字典树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系...

Java学习:JDBC各类详解

 JDBC各个类详解 代码实现: //1.导入驱动jar包 //2.注册驱动 Class.forName("com.mysql.jdbc.Driver"); //3.获取数据库连对象 Connection conn = DriverManager.getConnection("jdbc:mysql://localhost:3306/db3","root",...

[Spark]-作业调度与动态资源分配

1.概述   由 Spark 集群篇 ,每个Spark应用(其中包含了一个SparkContext实例),都会运行一些独占的执行器(executor)进程.集群调度器会提供对这些 Spark 应用的资源调度.   而在各个Spark应用内部,各个线程可能并发地通过action算子提交多个Spark作业(job).这里就是Spark的作业调度   Spark...

JAVA8之Stream

流与集合 集合是一个内存中的数据结构,集合中的每个元素都得先计算出来才能添加到集合中。 流与集合有以下不同: 1.无存储. stream不是一种数据结构,它只是某种数据源的一个视图 2.不可修改.对stream的任何修改都不会影响背后的数据源 3.可消费性.stream只能被消费一次. Collection:集合类接口. Collector:收集器,也是...

winform使用Barcodex控件预览和打印一维码

1、控件下载。   http://files.cnblogs.com/files/masonblog/barcodex.zip 。   包含barcodex.ocx控件、barcodex帮助文档、两个winform控件的dll文件。 2、控件的注册。 (1)检测控件是否注册(方法不唯一)。   本例使用的是判断注册表中 HKEY_CLASSES_ROOTT...

java第七天

p38~p41: 1、可以通过import 一个自定义类库(或者网上下的)在java中使用c风格的输入输出方式。 2、忘记优先顺序时应该用括号明确规定计算顺序。 3、java的操作符不同于c++,几乎只能操作“基本类型”,例外的是 ==、!=、=能操作所有对象,除此之外,String类支持“+”和“+=”。 4、System.out.print()语句中包...