台部落admin

原创論文 | 翻譯 ——A Novel K-medoids clustering recommendation algorithm……（2019：協同過濾RS）

目錄 <SCI 2> 0.專有詞彙 0.Abstract 1.Introduction 2.Literature overview 2.1.Similarity measure 2.2.Clustering technique 3.Res

2020-07-04 07:18:29

6

原创論文 | 翻譯 ——Improving performances of Top-N recommendations with co-clustering method（2020：協同過濾RS）

0.專有詞彙 interation data：交互數據（評分）bipartite network：二部網絡（二部圖） demograhic information：人口統計信息 probabilistic matrix factoriz

2020-07-04 07:18:29

4

原创 python3__零散問題處理

目錄 1.dataframe中可迭代元素因長度不同修改時報錯的問題 1.dataframe中可迭代元素因長度不同修改時報錯的問題原始代碼：將商品標題對應特徵詞列表轉換爲向量並重新賦值 for i in range(item

2020-07-04 07:18:29

原创論文|翻譯——Xi an Jiaotong University (Xi ZHAOs research summary)

1.作者簡介【姓名】：趙璽【個人主頁】：http://som.xjtu.edu.cn/info/1014/3587.htm 【研究方向】：大數據驅動的行爲理論、行爲分析和仿真；基於大數據行爲的決策支持；人工智能與深度學習；區塊鏈

2020-07-04 07:18:29

原创 python3進程分佈式進程

1.task_mater.py 在Thread和Process中，應當優選Process，因爲Process更穩定，而且，Process可以分佈到多臺機器上，而Thread最多隻能分佈到同一臺機器的多個CPU上。Python的multi

2020-07-04 07:18:29

原创網絡爬蟲 | 騰訊招聘信息採集——基於Python中Scrapy框架

目錄 1.爬蟲項目工具： 2.命令行scrapy重要參數： 3.爬蟲製作步驟： 4.爬蟲類Scrapy源碼剖析： 5.爬蟲運作流程： 6.爬取內容保存格式： 7.python3數據類型轉換函數： 8.網頁數據的抓取與保存 9.部分爬取結果

2020-05-20 09:57:11

原创網絡爬蟲 | 京東全站數據採集（類目、店鋪、商品、評論）——基於Python中Scrapy框架

1.定義採集數據的存儲結構【存儲結構說明】 class CategoriesItem(Item)：存儲京東類目信息 class ProductsItem(Item)：存儲京東商品信息 class ShopItem(Item)：存儲京東

2020-05-12 04:33:30

原创論文 | 翻譯——Xi'an Jiaotong University（Xi ZHAO's research summary）

1.作者簡介【姓名】：趙璽【個人主頁】：http://som.xjtu.edu.cn/info/1014/3587.htm 【研究方向】：大數據驅動的行爲理論、行爲分析和仿真；基於大數據行爲的決策支持；人工智能與深度學習；區塊鏈

2020-05-09 16:21:51

原创數學分析|最優化——梯度下降法、牛頓法、擬牛頓法等

1.最優化問題分類按照約束條件分，可以分爲：無約束優化問題、有不等式優化問題、有不等式優化問題。按照是否線性，可以分爲線性優化問題(目標函數和約束均線性)、非線性優化問題(目標函數和約束中任意部分非線性)。按是否凸，可以分爲凸優化

2020-04-23 07:59:47

1

原创圖論 | 無向圖 —— 二部圖/二分圖

目錄 1.二部圖概述 1.1.二部圖概念 1.2.二部圖定理 2.匹配問題 2.1.匈牙利算法 2.1.1.匈牙利樹 2.1.2.匈牙利算法 2.1.2.匈牙利算法代碼 2.2.KM算法 2.2.1.KM算法概念 2.2.2.KM算法 2

2020-04-20 05:53:45

原创 MongoDB | 基本概念 + 數據類型（二）

1.基本概念 1.1.數據庫（database） 1.1.1.基本性質 ①一個MongoDB中可建立多個數據庫 ②默認數據庫爲“db”，且存儲在“data”目錄當中 ③單個實例可容納多個獨立的數據庫，每一個都有自己的集合和權限，不同的數

2020-03-27 22:29:19

1

原创 MongoDB | 概述（一）

1.MongoDB概述 MongoDB 是由C++語言編寫的，是一個基於分佈式文件存儲的開源數據庫系統。在高負載的情況下，添加更多的節點，可以保證服務器性能，其旨在爲WEB應用提供可擴展的高性能數據存儲解決方案。MongoDB 將數據存

2020-03-27 22:29:19

原创推薦系統 | 重排序 —— 貝葉斯個性化排序(Bayesian Personalized Ranking, BPR)

目錄 1.“排序推薦算法”分類 2.貝葉斯個性化排序(Bayesian Personalized Ranking, BPR) 2.1.應用場景 2.2.BPR建模思路 2.2.1.【符號說明】 2.2.2.【BPR算法前提假設】 2.2.

2020-03-18 00:13:56

30

原创假設檢驗 | 非參數假設檢驗 —— KS檢驗

目錄 1.概述 2.優缺點 3.KS檢驗過程 4.python程序 1.概述 KS(Kolmogorov-Smirnow)是一種非參數的統計檢驗方法，是針對連續分佈的檢驗。這種檢測常被用來應用於比較單樣本是否符合某個已知分佈(將樣本數據

2020-03-13 23:01:56

4

原创論文 | 翻譯 ——A Novel K-medoids clustering recommendation algorithm……（2019：推薦系統）

目錄 <SCI 2> 0.專有詞彙 0.Abstract 1.Introduction 2.Literature overview 2.1.Similarity measure 2.2.Clustering technique 3.Res

2020-03-12 15:38:41

3