Wenyu's Blog
Wenyu's Blog


  • 首页

  • 分类

  • 博文归档

  • 标签云

  • 搜索
close

Seaborn库的使用

发表于 2018-02-07   |   分类于 机器学习

CountPlot

%matplotlib inline
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

train_data=pd.read_csv('./data/train.csv')
sns.countplot(x='Score',data=train_data)
阅读全文 »

【汽车口碑分析】3.爬取汽车评论数据

发表于 2018-02-03   |   分类于 项目

环境配置

  • Ubuntu 16.04
  • Python 3.5

技术框架

  • Scrapy

需求目标

本项目为汽车口碑分析,第一步需要爬取对于不同车型的评论数据。

选择58车的车型分类爬取评论数据。

阅读全文 »

【分布式编程】四——Pycharm运行Python版Spark程序

发表于 2018-01-13   |   分类于 Spark

前言

此前搭建成功分布式Spark环境,此文介绍使用Pycharm运行Python语言的Spark程序。

操作步骤

安装Pycharm

  1. 点击下载。

  2. 过程与安装Intellij IDEA类似,在此不在赘述。

  3. 进入到安装目录下执行

    ./bin pycharm-sh
阅读全文 »

【分布式编程】三——基于VirtualBox的Spark完全分布式环境

发表于 2018-01-13   |   分类于 Spark

前言

Spark的搭建依赖于Hadoop,因此本文基于之前分布式Hadoop环境,JDK、Hadoop等已安装好,

系统环境

  • 虚拟机:VirtualBox
  • Linux:Ubuntu 16.04 LTS
  • HAdoop 2.7.5
  • IDE:Intellij IDEA
  • JDK 1.8.0_151
  • Scala-2.12.4
  • Spark-2.2.1
阅读全文 »

【分布式编程】二——基于Hadoop的MapReduce程序

发表于 2018-01-12   |   分类于 Hadoop

此前配置好分布式Hadoop环境,此篇主要讲解通过Intellij IDEA编写分布式MapReduce程序以及利用Hadoop实现词频统计

系统环境

  • 虚拟机:VirtualBox
  • Linux:Ubuntu 16.04 LTS
  • Hadoop 2.7.5
  • IDE:Intellij IDEA
  • JDK 1.8.0_151
    阅读全文 »

【分布式编程】一——基于VirtualBox的Hadoop完全分布式环境搭建

发表于 2018-01-02   |   分类于 Hadoop

系统架构

  • 虚拟机环境:VirtualBox

  • Linux系统:Ubuntu 16.04 LTS

  • 工具包

    • JDK1.8
    • Hadoop 2.7.5
      阅读全文 »

Hexo主题之NextD

发表于 2018-01-01   |   分类于 个人建站

简介

本次更改的主题为NextD,一款基于NexT而修改的主题。

阅读全文 »

Windows中CMD命令之Tree生成目录

发表于 2018-01-01   |   分类于 Windows

作用

以图形显示驱动器或路径的文件夹结构

格式

tree [path] [/f] [/a]
#/f 显示每个文件中文件的名称
#/a 使用ASCII字符,而不使用扩展字符

样例

tree C:\Users\Administrator\.android /f >F:\path\android-tree.txt

深入理解Java多态性

发表于 2017-12-29   |   分类于 Java

实例分析

class A{
public String show(D obj){
return ("A and D");
}
public String show(A obj){
return ("A and A");
}
}
class B extends A{
public String show(B obj){
return ("B and B");
}
public String show(A obj){
return ("B and A");
}
}
public class C extends B{

}
public class D extends B{

}

public class Test{
public static void main(String[] args){
A a1 = new A();
A a2 = new B();
B b = new B();
C c = new C();
D d = new D();

System.out.println("1--" + a1.show(b));
System.out.println("2--" + a1.show(c));
System.out.println("3--" + a1.show(d));
System.out.println("4--" + a2.show(b));
System.out.println("5--" + a2.show(c));
System.out.println("6--" + a2.show(d));
System.out.println("7--" + b.show(b));
System.out.println("8--" + b.show(c));
System.out.println("9--" + b.show(d));
}
}
阅读全文 »

利用Github Pages+Hexo搭建个人博客

发表于 2017-12-20   |   分类于 个人建站

技术简介

Github Pages

GitHub Pages 本来用于介绍托管在Github上的项目,由于它的空间免费稳定,因此适合用来搭建博客。

每个帐号只能有一个仓库来存放个人主页,且仓库的名字必须是username/username.github.io。你可以通过http://username.github.io来访问你的个人主页

个人主页的网站内容是在master分支下

阅读全文 »

Virtualbox 下LVS-NAT模式集群部署

发表于 2017-12-01   |   分类于 Linux

系统架构

  • 虚拟机环境:VirtualBox
  • Linux系统:CentOS 7
  • 模型:LVS-NAT
  • 调度算法:RR

【注】所有连接方式都采用桥接方式

主机 IP 角色
Client 192.168.33.145 客户机,用来访问网页
VS 192.168.33.150 VIP,Virtual Ip对外提供的IP
VS 192.168.33.149 DIP,Director IP
RS1 192.168.33.148 Real Server IP,安装Nginx
RS2 192.168.33.147 Real Server IP,安装Nginx
阅读全文 »

【评论文本分类】1.爬取评论数据

发表于 2017-12-01   |   分类于 项目

环境配置

  • Ubuntu 16.04
  • Python 3.5

技术框架

  • Scrapy
  • Selenium
  • PhantomJS

需求目标

对网址http://liuyan.cjn.cn/index.html进行数据爬取

本文爬虫有三层爬取,爬取结构层次如图所示,

阅读全文 »

Hexo之Indigo主题配置

发表于 2017-12-01   |   分类于 个人建站

正文宽度加宽

/themes/indigo/source/css/_partial/variable.less

把@contentWidth: 960px改成@contentWidth: 90%

同时config文件中修改cdn:false

阅读全文 »

CentOS 7 yum安装nginx-1.12.0

发表于 2017-11-29   |   分类于 Linux

CentOS 7 中的 yum 没法直接使用 yum install nginx 这个指令去安装nginx,因为nginx这个服务不是yum库中自带的。图1是官方提供的大致安装步骤,图2是官网提供的多个版本的nginx安装包,下面是我给合自己的系统环境总结的安装方法,供大家参考:

阅读全文 »

CentOS 添加新用户并授权Root权限

发表于 2017-11-28   |   分类于 Linux
  1. 切换到root用户
    su -

  2. 添加新用户
    useradd xxx

    阅读全文 »
123…6

78 日志
18 分类
40 标签云
RSS
GitHub
Creative Commons
© 2017 - 2018
由 Hexo 强力驱动
主题 - NexTD