原创 Neo4j筆記(二)Cypher(5)聚合

Cypher的聚合和別的語言不一樣,比如在SQL中聚合是通過group by實現的,而在cypher中是通過聚合函數默認聚合的。看一個例子: match(n:Person) return n.name, count(n.name) 表面上

原创 物體分類(四)ResNet

前言 ResNet(Residual Neural Network)由微軟研究院的Kaiming He、Xiangyu Zhang、Shaoqing Ren、Jian Sun四名華人提出,並在ILSVRC2015比賽中取得冠軍,在top5

原创 Neo.ClientError.Statement.TypeError: Expected Long(0) to be a org.neo4j.values.storable.TextValue

LOAD CSV WITH HEADERS FROM 'https://neo4j.com/docs/cypher-manual/3.5/csv/artists-with-headers.csv' AS line CREATE (:Ar

原创 Neo4j筆記(二)Cypher(9)cypher時間處理

1、date date函數默認返回當前時區的當前日期,如: RETURN date()   //結果:"2019-05-24" 。具體使用方法如下: date()                                     

原创 Neo4j筆記(一)算法(2)算法實例

一、中心度算法 1、PageRank 1.1  算法介紹 PageRank最初是谷歌推出用來計算網頁排名的,簡單的說就是,指向這個網頁的鏈接數越多,那麼這個網頁就越重要。但是很可能會有人自己製作一些垃圾網頁設置大量的鏈接指向自己的網頁來提

原创 Neo4j筆記(二)Cypher(6)UNWIND和FOREACH

unwind是cypher提供的一種列表遍歷工具,類似於python中的for循環,unwind結合case等語法可以寫出許多複雜的查詢,尤其是對於路徑查詢的處理。foreach也是cypher提供的一個列表遍歷工具,但是主要用來做增刪改

原创 Neo4j筆記(二)Cypher(8)函數

關於cypher中的函數有兩點需要注意: (1)如果輸入是null,則函數返回null。 (2)字符串輸入都是Unicode字符,而不是標準字符集,比如 size("你") 的結果是1。 一、斷言函數 1、all 語法:all(varia

原创 Hive小技巧和調優

作爲Hadoop生態圈中的重要組件,Hive在數據分析、處理方面扮演着異常重要的角色。另外,Hive作爲大數據組件,處理的數據量往往很大,合適的優化技巧在運行效率方面往往可以起到非常好的效果。 1、篩選重複記錄 這是在業務中經常遇到的一個

原创 TensorFlow筆記(四)Word2Vector詳解

一、前言 文本處理處理任務(NLP)是一個在深度學習領域非常常見的任務,同時也是一個非常熱門的分支領域。早期的NLP問題主要有文本翻譯、詞預測等。例如,給出一句話中間少了一個詞,預測最可能是什麼詞。早期的語言模型是基於概率計算的,會去計算

原创 Neo4j筆記(五)APOC(1)數據導入導出

前言 一直以來都想記錄一下關於Neo4j APOC工具包的使用筆記,最近又需要用到裏面的一些東西,決定開始記錄下來。apoc作爲Neo4j的擴展包,使用得當,在開發中可以帶來很大的便利。下面的筆記都是以linux下的Neo4j 服務器版和

原创 TensorFlow筆記(三)常用操作函數

基礎操作函數 tf.abs(x, name=None) 計算張量的絕對值,輸入一個 Tensor 或 SparseTensor,返回一個與 x 有相同的大小和類型 的 Tensor 或 SparseTensor。 tf.add(x,

原创 機器學習筆記(一)數據預處理

在機器學習建模中,因爲大多數數據並不是格式化、規範化數據,不能直接輸入到模型中,因此,第一步往往是根據數據分析結果對數據進行預處理,或者叫特徵處理,常見的數據預處理過程包括:標準化、離散化、降維、數據抽樣等。 1. 數據標準化 (1)最大

原创 TinkerPop集成Hadoop+Spark

前言 前面介紹了TinkerPop集成Neo4j的配置方法,並且實現了HA操作。這裏有一個突出問題就是不管是使用Neo4j,還是自帶的TinkerGraph都不可避免的面臨一個問題——大數據量場景,也即分佈式問題。鑑於此,Tinkerpo

原创 TinkerPop集成Neo4j

簡介 ThinkerPop是由Apache開發,面向實時事務處理(OLAP)以及批量、分析型(OLTP)的開源圖計算框架。TinkerPop可以應用於不同圖數據庫的抽象層,避免應用程序與特定數據庫高度依賴。Tinkerpop提供的通用AP