原创 二維數組中的查找(Python)

題目:在一個二維數組中,每一行都按照從左到右遞增的順序排序,每一列都按照從上到下遞增的順序排序。請完成一個函數,輸入這樣的一個二維數組和一個整數,判斷數組中是否含有該整數。例如下面的二維數組就是每行、每列遞增排序。如果在這個數組中查找數

原创 倒排索引(Inverted Index)

倒排索引(英語:Inverted index),也常被稱爲反向索引、置入檔案或反向檔案,是一種索引方法,被用來存儲在全文搜索下某個單詞在一個文檔或者一組文檔中的存儲位置的映射。它是文檔檢索系統中最常用的數據結構。通過倒排索引,可以根據單詞

原创 高德地圖之Python爬取上海市所有道路輪廓座標

任務內容:根據某個城市的經緯度座標範圍,將城市範圍劃分成一個個的小網格,依次爬取每個網格內的道路id,name,存儲至excel文件,然後再根據道路id,爬取每條道路的座標輪廓。 步驟: step1:申請高德地圖的key,之後調用接口時會

原创 Noisy channel model and POS tagging

Noisy channel model and POS tagging 一、Noisy Channel Model 很多問題涉及根據數據X預測標籤Y,比如: 語音識別,機器翻譯(X是源語言,Y是目標語言),拼寫糾錯(X是帶有拼寫錯誤的源文

原创 平滑方法

在自然語言處理中,經常會遇到要計算單詞或者句子在詞典或文檔中出現的頻次,但是會存在某個單詞在詞典中沒有出現的情況,計算時概率爲0,爲了改善這種情況,人們提出的平滑方法。 1、Add-one Smoothing(Laplace Smooth

原创 前端實時搜索實現(input框邊輸入邊查詢)

1、實現效果 使用ajax提交數據。 代碼如下 <!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <meta name="viewport" cont

原创 前端時間選擇控件

1、HTML代碼 <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>首頁</title> <meta http-equiv

原创 中文分詞-前向最大匹配和後向最大匹配

  例子:sentence = "我是一名計算機專業的學生" 詞典:["我", "是", "一", "一名", "計算機", "的", "學生", "專業"] 前向最大匹配 給定max_length = 5 首先判斷word = “我是一

原创 中文單詞的表示以及相似度計算方法

詞的獨熱表示(one-hot representation) boolean representation count representation 給定一個詞典:[我,是,計算機專業,的,學生] 1、求給定單詞的表示:        

原创 修改jupyter保存位置

1、打開cmd命令行,執行命令jupyter notebook --generate--config(注意:都是--,而不是-) 2、 在展示列出的各種指令下,找到紅色框框中標出的。 3、執行指令:jupyter notebook -

原创 《統計學習方法》第一版袁春老師PPT課件

課件下載地址傳送門,ps:是pdf版本 http://www.sz.tsinghua.edu.cn/fg3/105064.jhtml

原创 本地瀏覽器訪問遠程服務器上的Tensor Board步驟

背景:服務器上是linux系統,本地是windows10,服務器和本地在同一局域網 1、在服務器上正常啓動tensorboard       tensorboard  --logdir=xxx  --port=6006(summary存儲

原创 記錄基於深度學習的自然語言處理bug

1。Only one class present in y_true. ROC AUC score is not defined in that case 問題背景:模型用於解決二分類問題,輸入數據標籤爲0,1 解決辦法:打印驗證集數據標

原创 CryptoZombies教程之應用前端和web3.js

第1章: 介紹 Web3.js 完成第五課以後,我們的殭屍 DApp 的 Solidity 合約部分就完成了。現在我們來做一個基本的網頁好讓你的用戶能玩它。 要做到這一點,我們將使用以太坊基金髮布的 JavaScript 庫 —— Web

原创 CryptoZombies教程之ERC721標準和加密收藏品

讓我們來聊聊 _代幣_. 如果你對以太坊的世界有一些瞭解,你很可能聽過人們聊到代幣——尤其是 ERC20 代幣. 一個 _代幣_ 在以太坊基本上就是一個遵循一些共同規則的智能合約——即它實現了所有其他代幣合約共享的一組標準函數,例如 tr