原创 使用Scala語言通過Spark實現Join
join join類似於SQL的inner join操作,返回結果是前面和後面集合中配對成功的,過濾掉關聯不上的。 leftOuterJoin leftOuterJoin類似於SQL中的左外關聯left outer join,返回結果以前
原创 C++ 容器類 vector
vector(向量),C++中的一種容器類,它相當於一個動態的數組。 用法: 文件頭 #include<vector> 函數調用: 目錄 1. 創建vector容器 2. vector獲取(訪問)元素 3. vector添加(增加)元素
原创 C++ 二維的數組、vector 初始化爲0
1、vector 初始化爲二維,元素全爲0 vector<vector<int> > myvec(n, vector<int>(n, 0)); 2、二維數組初始化爲0 int myvec[n][n]; memset(myvec,0,s
原创 Linux 部署 Elasticsearch和Kibana
官方網址 https://www.elastic.co/cn/ 一、Elasticsearch 下載最新版本,地址,https://www.elastic.co/cn/downloads/elasticsearch 1 解壓,免安裝 t
原创 十大經典排序算法 Python代碼 動圖演示
排序算法可以分爲內部排序和外部排序,內部排序是數據記錄在內存中進行排序,而外部排序是因排序的數據很大,一次不能容納全部的排序記錄,在排序過程中需要訪問外存。 常見的內部排序算法有:插入排序、希爾排序、選擇排序、冒泡排序、歸併排序、快速排序
原创 Attention Transformer 精簡原理總結
目錄 一. Attention 二. Self-Attention 三. Transformer 3.1 multi-headed 3.2 Positional Encoding 3.3 Add & Normalize 殘差網絡 La
原创 通俗易懂解釋知識圖譜(Knowledge Graph)
歡迎轉載,轉載請註明出處https://www.cnblogs.com/huangyc/p/10043749.html 歡迎溝通交流: [email protected] 0. 目錄 1. 前言 2. 知識圖譜定義 3. 數據類型和存儲方
原创 綜述 詞向量與分佈式表示
從古老的one-hot表示法,到大熱的Word2vec系列的分佈式表示方法,再到現在驚豔的預訓練模型ELMo、BERT等,技術迭代迅速,這其中包含許多內容需要我們學習,例如語言模型LM、Transformer、CBOW、SkipGram等
原创 句法分析
本文將總結句法分析的相關內容。 自然語言處理的分析技術,可以大致分爲三個層面。 第一層是詞法分析,包括分詞(Word Segmentation)、詞性標註(Part-of-speech Tagging)、命名實體識別(Named Enti
原创 自然語言處理中的自注意力機制(Self-attention Mechanism)
轉發自https://www.cnblogs.com/robert-dlut/p/8638283.html 自然語言處理中的自注意力機制(Self-attention Mechanism) 近年來,注意力(Attention)機制被廣泛應
原创 NLP自然語言處理基礎技術工具 彙總
目前,有很多開源或開放的自然語言處理工具可以供我們使用,可以方便地解決很多NLP的基礎任務,例如,分詞、詞性標註、詞幹化、命名實體識別、名詞短語提取等等。 彙總起來方便比較,擇優而用。 目錄 1. HanLP 2. SpaCy 1.
原创 支持向量機(SVM)常見問題
1 SVM原理 SVM是一種二分類模型。它的基本模型是在特徵空間中尋找間隔最大化的分離超平面的線性分類器。(間隔最大化是它的獨特之處),通過該超平面實現對未知樣本集的分類。 當訓練樣本線性可分時,通過硬間隔最大化,學習一個線性分類器,即線
原创 Java中List集合的四中遍歷方式
java 遍歷arrayList的四種方法 轉自:http://www.cnblogs.com/interdrp/p/3663602.html package com.test; import java.util.Ar
原创 LSTM神經網絡
轉自 http://m.blog.csdn.net/article/details?id=52081301 簡單理解LSTM神經網絡 遞歸神經網絡 在傳統神經網絡中,模型不會關注上一時刻的處理會有什麼信息可以用於下一時刻
原创 linux tensorflow keras 安裝
1、使用pip安裝tensorflow $ pip install tensorflow # Python 2.7; CPU support (no GPU support) $ pip3 install tensorflow # P