B站視頻彈幕

B站視頻彈幕

原創

2020-05-21 05:21

import requests
# import jieba
# import pandas
# import matplotlib.pyplot as plt
# from wordcloud import WordCloud, ImageColorGenerator
from bs4 import BeautifulSoup


# def jieba_cut(sentence):
#     # seg = jieba.cut(sentence)
#     segList = []
#     for i in seg:
#         segList.append((i))
#     return segList


if __name__ == '__main__':
    str = ''
    url = 'http://comment.bilibili.com/36773399.xml'
    page = requests.get(url)
    page.encoding = 'utf-8'
    soup = BeautifulSoup(page.text, "html.parser")
    content = soup.find_all('d')
    for i in content:
        # str = str + i.text
        print(i.text)
    # with open('bilibili.txt', 'w', encoding='utf-8') as f:
    #     f.write(str)
    #
    # dict = {}

    # with open('bilibili.txt', 'r', encoding='utf-8') as f:
    #     words = jieba_cut(f.read())
    #     wordslist = set(words)
    #     for word in wordslist:
    #         dict[word] = words.count(word)

        # mask = plt.imread(r'H:\129\wallhaven-627476.jpg')

        # text = ' '.join(words)
        # wc = WordCloud(
        #     width=1000,
        #     height=800,
        #     margin=2,
        #     background_color='white',  # 設置背景顏色
        #     font_path='C:\Windows\Fonts\STZHONGS.TTF',  # 若是有中文的話，這句代碼必須添加，不然會出現方框，不出現漢字
        #     max_words=1000,  # 設置最大現實的字數
        #     max_font_size=400,  # 設置字體最大值
        #     random_state=50,  # 設置有多少種隨機生成狀態，即有多少種配色方案
        #     mask=mask,
        # )
        # mycloud = wc.generate(text)
        # image_colors = ImageColorGenerator(mask)
        #
        # wc.recolor(color_func=image_colors)
        # wc.to_file('cloudword.jpg')

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

985 碩士程序員，空窗 4 個月沒有 Offer！

一文搞懂 Spring 循環依賴

賽博鬥地主——使用大語言模型扮演Agent智能體玩牌類遊戲。

VScode右鍵打開(添加到右鍵)

記一次 .NET某工控視覺自動化系統卡死分析

WindowsServer--SQL Server搭建主從同步實現讀寫分離 - 事務性分發

java由於越界導致的報錯

liunx上傳文件服務

Python爬蟲js處理

MongoDB和MySQL遠程連接

seleinum 的簡單配置與使用

Pyspider配置本地數據庫

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結