pyspark 安装配置【linux && win】

摘要:
2、linux环境只需要安装jdk、spark、pyspark即可;windows环境还需要额外安装hadoop组件,否则运行报错。
一、windows 安装
1、下载spark
   http://mirrors.tuna.tsinghua.edu.cn/apache/spark/spark-2.3.1/spark-2.3.1-bin-hadoop2.7.tgz 

2、配置spark 环境变量
set SPARK_HOME=d:spark2.3.1set PATH=%SPARK_HOME%in;%PATH%

3、安装python的pyspark模块
pip install pyspark -i https://pypi.tuna.tsinghua.edu.cn/simple/ 

4、下载安装hadoop 或者 组件
1)下载hadoop软件包,并配置环境变量
set HADOOP_HOME=d:hadoop
set PATH=%HADOOP_HOME%in;%PATH%

2)下载hadoop-common-2.2.0-bin-master.zip(自己百度) 并配置环境变量
下载后是文件名是hadoop-common-2.2.0-bin-master.zip,随便解压到一个目录,设置HADOOP_HOME环境变量,指向 d:hadoop (解压后的下载文件), 并将HADOOP_HOME加到系统变量PATH中
set HADOOP_HOME=d:hadoop
set PATH=%HADOOP_HOME%in;%PATH%
二、linux 环境
1、下载spark
    wget http://mirrors.tuna.tsinghua.edu.cn/apache/spark/spark-2.3.1/spark-2.3.1-bin-hadoop2.7.tgz 
    tar -zxvf  spark-2.3.1-bin-hadoop2.7.tgz

2、配置spark 环境变量
vi ~/.bash_profile
#将以下代码添加到文件中
export SPARK_HOME=/tools/spark2.3.1export PATH=$SPARK_HOME/bin:$PATH
export PYTHONPATH=$SPARK_HOME/python/:$PYTHONPATH 

3、安装python的pyspark模块
   pip install pyspark -i https://pypi.tuna.tsinghua.edu.cn/simple/ 
注释:
1、如果想在python项目中使用spark 功能,python开发环境除了安装pyspark 模块外,还需要同时安装spark软件包才能正常使用。
2、linux 环境只需要安装jdk、spark、pyspark(python模块)即可;windows 环境还需要额外安装hadoop组件,否则运行报错。

免责声明:文章转载自《pyspark 安装配置【linux && win】》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇五、优先级队列括号匹配问题,栈下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

Linux/CentOS系统同步网络时间的2种方法详解

方法一:用 ntpdate从时间服务器更新时间 如果系统没有 ntpdate 命令,可在线安装:       yum -y install ntp 安装完了之后,你不要做什么配置,也不需要,直接测试一下 [root@snsgou-pc src]# date 2015年 05月 20日 星期三 22:42:19CST [root@snsgou-pc src]...

Linux(CentOS6)上安装python3.6 并创建虚拟环境 -----最牛逼的方法

...安装IUS,IUS provides Red Hat Package Manager(RPM) packages for some newer versions of select software. ...https://ius.io/GettingStarted/ yum upateyum install https://centos6.ius...

Linux系统下查找安装包所在目录的六种方法

想知道Linux系统下安装了哪些软件包,以及软件包安装在哪个目录下,可以用以下6种命令 1. whichwhich命令查找出相关命令是否已经在搜索路径中,例子如下:$which gcc //显示出GNC的C编译器安装在哪个目录返回结果为:/usr/bin/gcc注意:如果which没有找到要找的命令,可以试试whereis,该命令搜索更大的范围的系统目录。...

以神经网络使用为例的Matlab和Android混合编程

由于需要在一个Android项目中使用神经网络,而经过测试发现几个Github上开源项目的训练效果就是不如Matlab的工具箱好,所以就想在Android上使用Matlab神经网络代码(可是。。。) 这个问题大概处理了两天,原本预计5个小时的。。。 过程遇到了诸多一手坑以及看到相关资料的对新手不友好,所以就把过程记录下来希望能给后来者一些帮助 这个教程从0...

CentOS 7下安装go环境

Golang 安装 首先我们到Golang 官网(由于国内无法访问 Golang 官网,推荐到Golang 中文网下载安装包)下载一个对应操作系统的安装包。 $ cd /tmp && wget https://studygolang.com/dl/golang/go1.16.6.linux-amd64.tar.gz 解压缩安装包: $ su...

软件测试从业者必备的高频Linux命令

命令 cd 1.如何进入上级目录 cd .. 2.如何进入当前用户主目录 cd ~ 3.如何进入上两级目录 cd ../.. 4.进入当前目录命令 cd . 5.如何进入目录 /usr/isTester cd /usr/isTester 命令 mv 1.移动一个文件夹(isTester文件夹,移动到/APP/www目录) mv ~/isTester/ /A...