原创 論文 | 翻譯 ——A Novel K-medoids clustering recommendation algorithm……(2019:協同過濾RS)

目錄 <SCI 2> 0.專有詞彙 0.Abstract 1.Introduction 2.Literature overview 2.1.Similarity measure 2.2.Clustering technique 3.Res

原创 論文 | 翻譯 ——Improving performances of Top-N recommendations with co-clustering method(2020:協同過濾RS)

0.專有詞彙 interation data:交互數據(評分)bipartite network:二部網絡(二部圖) demograhic information:人口統計信息 probabilistic matrix factoriz

原创 python3__零散問題處理

目錄 1.dataframe中可迭代元素因長度不同修改時報錯的問題 1.dataframe中可迭代元素因長度不同修改時報錯的問題 原始代碼:將商品標題對應特徵詞列表轉換爲向量並重新賦值 for i in range(item

原创 論文|翻譯——Xi an Jiaotong University (Xi ZHAOs research summary)

1.作者簡介 【姓名】:趙璽 【個人主頁】:http://som.xjtu.edu.cn/info/1014/3587.htm 【研究方向】:大數據驅動的行爲理論、行爲分析和仿真;基於大數據行爲的決策支持;人工智能與深度學習;區塊鏈

原创 python3__進程__分佈式進程

1.task_mater.py 在Thread和Process中,應當優選Process,因爲Process更穩定,而且,Process可以分佈到多臺機器上,而Thread最多隻能分佈到同一臺機器的多個CPU上。Python的multi

原创 網絡爬蟲 | 騰訊招聘信息採集——基於Python中Scrapy框架

目錄 1.爬蟲項目工具: 2.命令行scrapy重要參數: 3.爬蟲製作步驟: 4.爬蟲類Scrapy源碼剖析: 5.爬蟲運作流程: 6.爬取內容保存格式: 7.python3數據類型轉換函數: 8.網頁數據的抓取與保存 9.部分爬取結果

原创 網絡爬蟲 | 京東全站數據採集(類目、店鋪、商品、評論)——基於Python中Scrapy框架

1.定義採集數據的存儲結構 【存儲結構說明】 class CategoriesItem(Item):存儲京東類目信息 class ProductsItem(Item):存儲京東商品信息 class ShopItem(Item):存儲京東

原创 論文 | 翻譯——Xi'an Jiaotong University(Xi ZHAO's research summary)

1.作者簡介 【姓名】:趙璽 【個人主頁】:http://som.xjtu.edu.cn/info/1014/3587.htm 【研究方向】:大數據驅動的行爲理論、行爲分析和仿真;基於大數據行爲的決策支持;人工智能與深度學習;區塊鏈

原创 數學分析|最優化——梯度下降法、牛頓法、擬牛頓法等

1.最優化問題分類 按照約束條件分,可以分爲:無約束優化問題、有不等式優化問題、有不等式優化問題。 按照是否線性,可以分爲線性優化問題(目標函數和約束均線性)、非線性優化問題(目標函數和約束中任意部分非線性)。 按是否凸,可以分爲凸優化

原创 圖論 | 無向圖 —— 二部圖/二分圖

目錄 1.二部圖概述 1.1.二部圖概念 1.2.二部圖定理 2.匹配問題 2.1.匈牙利算法 2.1.1.匈牙利樹 2.1.2.匈牙利算法 2.1.2.匈牙利算法代碼 2.2.KM算法 2.2.1.KM算法概念 2.2.2.KM算法 2

原创 MongoDB | 基本概念 + 數據類型(二)

1.基本概念 1.1.數據庫(database) 1.1.1.基本性質 ①一個MongoDB中可建立多個數據庫 ②默認數據庫爲“db”,且存儲在“data”目錄當中 ③單個實例可容納多個獨立的數據庫,每一個都有自己的集合和權限,不同的數

原创 MongoDB | 概述(一)

1.MongoDB概述 MongoDB 是由C++語言編寫的,是一個基於分佈式文件存儲的開源數據庫系統。在高負載的情況下,添加更多的節點,可以保證服務器性能,其旨在爲WEB應用提供可擴展的高性能數據存儲解決方案。MongoDB 將數據存

原创 推薦系統 | 重排序 —— 貝葉斯個性化排序(Bayesian Personalized Ranking, BPR)

目錄 1.“排序推薦算法”分類 2.貝葉斯個性化排序(Bayesian Personalized Ranking, BPR) 2.1.應用場景 2.2.BPR建模思路 2.2.1.【符號說明】 2.2.2.【BPR算法前提假設】 2.2.

原创 假設檢驗 | 非參數假設檢驗 —— KS檢驗

目錄 1.概述 2.優缺點 3.KS檢驗過程 4.python程序 1.概述 KS(Kolmogorov-Smirnow)是一種非參數的統計檢驗方法,是針對連續分佈的檢驗。這種檢測常被用來應用於比較單樣本是否符合某個已知分佈(將樣本數據

原创 論文 | 翻譯 ——A Novel K-medoids clustering recommendation algorithm……(2019:推薦系統)

目錄 <SCI 2> 0.專有詞彙 0.Abstract 1.Introduction 2.Literature overview 2.1.Similarity measure 2.2.Clustering technique 3.Res