原创 Python爬蟲,使用BeautifulSoup解析頁面結果

Python爬蟲,使用BeautifulSoup可以輕鬆解析頁面結果,下面是使用該方法爬取boss頁面的職位信息:包括職位名稱、薪資、地點、公司名稱、公司融資情況等信息。通過這個示例可以輕鬆看到BeautifulSoup的使用方法。 1、爬

原创 IDEA集成Spark開發環境

IDEA集成Spark開發環境的pom文件<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-inst

原创 十大經典排序算法的算法描述和代碼實現

這裏詳細講解了十大經典算法的分類,例如交換排序、插入排序、選擇排序等比較類排序,以及計數排序、桶排序和基數排序的非比較類排序,分析了各種排序算法的複雜度和穩定性,還有JAVA代碼的詳細實現。對冒泡排序、插入排序、選擇排序和堆排序等十種算法進

原创 Linux允許打開最大文件句柄數的參數調優-"too many open files"問題

都知道Linux系統的特性,一切皆文件,所以在運行zabbix這樣的服務時,其中重要的一個調優就是調整linux系統的最大文件句柄數,解決“too many open files”的問題,增大程序運行允許打開的文件數,提高性能。 一.查看系

原创 Hadoop的HA環境搭建

一、集羣的規劃 Zookeeper集羣:192.168.176.131 (bigdata112)192.168.176.132 (bigdata113)192.168.176.135 (bigdata114) Hadoop集羣:192.16

原创 HDFS(NameNode)的聯盟:Federation

HDFS(NameNode)的聯盟:Federation,配置HDFS聯盟,多個NameNode節點同時存活,根據代理配置的路由規則處理客戶端不同的請求,實現負載均衡,同時也可以緩存更多的元信息,它與HA的區別在於,聯盟是多個NameNod

原创 Pyhton發送郵件

Python使用smtplib和email庫發送郵件,發送HTML格式正文,插入圖片,以及發送execl等文件。實例代碼如下: #/usr/bin/env python #-*- coding:utf-8 -*- #auther:yuanm

原创 Python連接Mysql、Influxdb、Redis的方法

一、在配置文件中配置相關連接參數 在conf.ini中:#mysql參數 [Mysql] host = 192.168.1.2 port = 3306 user = root passwd = pswdmysql db = student

原创 Linux系統的用戶和用戶組管理

一、用戶(user)和用戶組(group)概念 1、用戶(user)的概念 Linux 是典型的多用戶操作系統,我們可以建若干用戶(user),用於系統服務的運行和權限管理,不同的用戶登陸系統,按照設定的權限去操作系統,提高了安全性。在Li

原创 Zabbix的企業級監控架構搭建—zabbix_server的安裝

zabbix運行的系統環境是LNMP平臺,這裏主要總結了一些自己在生產環境中安裝zabbix_server的過程和方法,因爲某些原因,這套過程在CentOS,Suse,Eulor系統均反覆嘗試過,都可以成功安裝zabbix_server。我

原创 Mysql數據庫的備份和恢復—XtraBackup工具中的innobackupex備份恢復方法

在生產環境中,對數據庫進行備份是十分重要的,數據庫運行異常或者是運維人員誤操作,造成數據丟失,可以將備份進行快速恢復,最大程度地降低損失。當然,數據庫地備份也有多種方法,例如簡單地冷備和稍微複雜點的邏輯備份,都可以藉助工具輕鬆實現。根據不同

原创 Zabbix的企業級監控架構搭建—配置zabbix的web頁面支持中文

Zabbix安裝後web頁面的選項和監控圖形顯示都是英文的,使用過程中總是感覺會有些不習慣,這時候我們可以通過簡單配置,即可實現支持中文環境的效果,在這裏做一下總結吧。 一.通過用戶的設置 通過用戶設置,只要安裝php時支持了gettext