CountPlot
%matplotlib inline |
%matplotlib inline |
此前搭建成功分布式Spark环境,此文介绍使用Pycharm运行Python语言的Spark程序。
点击下载。
过程与安装Intellij IDEA类似,在此不在赘述。
进入到安装目录下执行
./bin pycharm-sh |
Spark的搭建依赖于Hadoop,因此本文基于之前分布式Hadoop环境,JDK、Hadoop等已安装好,
此前配置好分布式Hadoop环境,此篇主要讲解通过Intellij IDEA编写分布式MapReduce程序以及利用Hadoop实现词频统计
以图形显示驱动器或路径的文件夹结构
tree [path] [/f] [/a] |
tree C:\Users\Administrator\.android /f >F:\path\android-tree.txt |
class A{ |
GitHub Pages 本来用于介绍托管在Github上的项目,由于它的空间免费稳定,因此适合用来搭建博客。
每个帐号只能有一个仓库来存放个人主页,且仓库的名字必须是username/username.github.io
。你可以通过http://username.github.io
来访问你的个人主页
个人主页的网站内容是在master分支下
【注】所有连接方式都采用桥接
方式
主机 | IP | 角色 |
---|---|---|
Client | 192.168.33.145 | 客户机,用来访问网页 |
VS | 192.168.33.150 | VIP,Virtual Ip对外提供的IP |
VS | 192.168.33.149 | DIP,Director IP |
RS1 | 192.168.33.148 | Real Server IP,安装Nginx |
RS2 | 192.168.33.147 | Real Server IP,安装Nginx |
对网址http://liuyan.cjn.cn/index.html
进行数据爬取
本文爬虫有三层爬取,爬取结构层次如图所示,
/themes/indigo/source/css/_partial/variable.less
把@contentWidth: 960px
改成@contentWidth: 90%
同时config
文件中修改cdn:false
CentOS 7 中的 yum 没法直接使用 yum install nginx 这个指令去安装nginx,因为nginx这个服务不是yum库中自带的。图1是官方提供的大致安装步骤,图2是官网提供的多个版本的nginx安装包,下面是我给合自己的系统环境总结的安装方法,供大家参考:
切换到root
用户su -
添加新用户useradd xxx