网站运营
位置:首页>> 网站运营>> linux环境不使用hadoop安装单机版spark的方法

linux环境不使用hadoop安装单机版spark的方法

作者:stpeace  发布时间:2023-08-06 06:00:28 

标签:linux,hadoop,spark,安装

大数据持续升温, 不熟悉几个大数据组件, 连装逼的口头禅都没有。 最起码, 你要会说个hadoop, hdfs, mapreduce, yarn, kafka, spark, zookeeper, neo4j吧, 这些都是装逼的必备技能。

关于spark的详细介绍, 网上一大堆, 搜搜便是, 下面, 我们来说单机版的spark的安装和简要使用。

0.  安装jdk,  由于我的机器上之前已经有了jdk, 所以这一步我可以省掉。 jdk已经是很俗气的老生常谈了, 不多说, 用java/scala的时候可少不了。


ubuntu@VM-0-15-ubuntu:~$ java -version
openjdk version "1.8.0_151"
OpenJDK Runtime Environment (build 1.8.0_151-8u151-b12-0ubuntu0.16.04.2-b12)
OpenJDK 64-Bit Server VM (build 25.151-b12, mixed mode)
ubuntu@VM-0-15-ubuntu:~$

1.  你并不一定需要安装hadoop, 只需要选择特定的spark版本即可。你并不需要下载scala, 因为spark会默认带上scala shell. 去spark官网下载, 在没有hadoop的环境下, 可以选择:spark-2.2.1-bin-hadoop2.7, 然后解压, 如下:


ubuntu@VM-0-15-ubuntu:~/taoge/spark_calc$ ll
total 196436
drwxrwxr-x 3 ubuntu ubuntu   4096 Feb 2 19:57 ./
drwxrwxr-x 9 ubuntu ubuntu   4096 Feb 2 19:54 ../
drwxrwxr-x 13 ubuntu ubuntu   4096 Feb 2 19:58 spark-2.2.1-bin-hadoop2.7/
-rw-r--r-- 1 ubuntu ubuntu 200934340 Feb 2 19:53 spark-2.2.1-bin-hadoop2.7.tgz

2.  spark中有python和scala版本的, 下面, 我来用scala版本的shell, 如下:


ubuntu@VM-0-15-ubuntu:~/taoge/spark_calc/spark-2.2.1-bin-hadoop2.7$ bin/spark-shell
Using Spark's default log4j profile: org/apache/spark/log4j-defaults.properties
Setting default log level to "WARN".
To adjust logging level use sc.setLogLevel(newLevel). For SparkR, use setLogLevel(newLevel).
18/02/02 20:12:16 WARN NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
18/02/02 20:12:16 WARN Utils: Your hostname, localhost resolves to a loopback address: 127.0.0.1; using 172.17.0.15 instead (on interface eth0)
18/02/02 20:12:16 WARN Utils: Set SPARK_LOCAL_IP if you need to bind to another address
Spark context Web UI available at http://172.17.0.15:4040
Spark context available as 'sc' (master = local[*], app id = local-1517573538209).
Spark session available as 'spark'.
Welcome to
  ____       __
  / __/__ ___ _____/ /__
 _\ \/ _ \/ _ `/ __/ '_/
 /___/ .__/\_,_/_/ /_/\_\  version 2.2.1
  /_/
Using Scala version 2.11.8 (OpenJDK 64-Bit Server VM, Java 1.8.0_151)
Type in expressions to have them evaluated.
Type :help for more information.
scala>

来进行简单操作:


scala> val lines = sc.textFile("README.md")
lines: org.apache.spark.rdd.RDD[String] = README.md MapPartitionsRDD[1] at textFile at <console>:24
scala> lines.count()
res0: Long = 103
scala> lines.first()
res1: String = # Apache Spark
scala> :quit
ubuntu@VM-0-15-ubuntu:~/taoge/spark_calc/spark-2.2.1-bin-hadoop2.7$
ubuntu@VM-0-15-ubuntu:~/taoge/spark_calc/spark-2.2.1-bin-hadoop2.7$
ubuntu@VM-0-15-ubuntu:~/taoge/spark_calc/spark-2.2.1-bin-hadoop2.7$  
ubuntu@VM-0-15-ubuntu:~/taoge/spark_calc/spark-2.2.1-bin-hadoop2.7$ wc -l README.md
103 README.md
ubuntu@VM-0-15-ubuntu:~/taoge/spark_calc/spark-2.2.1-bin-hadoop2.7$ head -n 1 README.md
# Apache Spark
ubuntu@VM-0-15-ubuntu:~/taoge/spark_calc/spark-2.2.1-bin-hadoop2.7$

来看看可视化的web页面, 在Windows上输入:  http://ip:4040

linux环境不使用hadoop安装单机版spark的方法

OK,  本文仅仅是简单的安装, 后面我们会继续深入介绍spark.

来源:https://blog.csdn.net/stpeace/article/details/79242999

0
投稿

猜你喜欢

  • FTP站点是因特网上比较重要的资源,但是登录FTP网站和操作FTP站点上的文件或文件夹仍然比较繁琐。我们知道,在资源管理器器可以把一个远程电
  • 火狐公布火狐4.0版的更多技术详情北京时间5月11日消息,据国外媒体报道,火狐(Firefox)浏览器开发商Mozilla技术开发副总裁迈克
  • 随着中国互联网的迅猛发展,关注网络的人不断增加,各行各业的人士们开始搭建自己的网络宣传平台,建立自己的博客,为此也涌现出一批批优秀的博主,如
  • 1 . 社会充满不公平现象。你先不要想去改造它,只能先适应它。(因为你管不了它)。2 . 世界不会在意你的自尊,人们看的只是你的成就。在你没
  • 1、网站打开的速度要快;网站的打开速度,直接影响用户对所使用网站的感受。很难想像,一个半天都打不开的网站会给浏览者一种什么样的感觉。如果是我
  • 我的师父黄裳@岳旭强曾经说过,“好的架构图充满美感”,一个架构好不好,从审美的角度就能看得出来。后来我看了很多系统的架构,发现这个言论基本成
  • 各位站长好,以前给百度客服打过N次电话,每每问及近期收录相关事谊都不给允回答。今天又打了一次。接电话的是个男的,听声音好像未成年...(日小
  • 内容摘要:为了把损失降低到最低限度,我们一定要有安全观念,并掌握一定的安全防范措施,禁绝让黑客无任何机会可趁。下面我们就来研究一下那些黑客是
  • 我们都知道关键词分析在算法中起着承上启下的作用。百度在还没调整算法之前所用的关键词分析是最大匹配法:正向匹配法,逆向匹配法和双向匹配法。比如
  • 10月27日消息,阿里巴巴CEO马云在《纽约时报》发表署名文章,就如何支持小企业等问题进行了阐述,以下是全文:全球经济衰退的来袭令许多国际企
  • 1、网页使用框架框架内的内容通常不在搜索引擎抓取的范围之内。2、图片太多,文本太少3、提交页面转向另一网站搜索引擎可能完全跳过这个页面。4、
  • 编者按:图形网络游戏鼻祖《万王之王》过去十年走过的历程,是中国网游发展史上的一面镜子。通过回顾它,我们能更清晰地还原过去所遇挫折与辉煌的本源
  • 其实,Windows2000 含有很多的安全功能和选项,如果你合理的配置它们,那么windows 2000将会是一个很安全的操作系统。具体清
  • 这是一个系列文章,无论你是新手还是高手,如果你对datafeed一无所知,可以借鉴一下。熟知datafeed之后,你能达到一个什么目的:你可
  • 5月12日消息,近日,微软董事长比尔盖茨表示,微软将在5月底推出一个免费的可以探索夜空影像的桌面软件工具,该工具名为全球望远镜(WorldW
  • 阿里云论坛上的资源很丰富,查了下安装LAMP环境,很多基础性的东西已经内置了,比如防火墙的配置和端口的开启,统统不需要再做操作,所以安装下来
  • 北京10月16日电2008年12月24日台湾异想数位娱乐有限公司和大陆淘米公司签订合同。《摩尔庄园》在台正式上线。初期推广与大玩国配合,将摩
  • 日本著名3D GALGAME游戏厂商Illusion公司官方网站近日放出了一段其将在明年2月19日发售的最新作《真实的女朋友》(リアル彼女,
  • 搜索引擎是不断地在发展,所以规律也在不停地变化,需要随时跟踪搜索引擎的新动态。这里整理了200个搜索引擎算法的相关因素,好东西啊!1. 关键
  • 上次装好了PHP,MySQL,还缺个MySQL图形化管理工具。MySQL图形化管理工具有很多,phpmyadmin无疑是必装的,国外空间大多
手机版 网站运营 asp之家 www.aspxhome.com