TPC-H 將DBGEN生成的數據表格導入數據庫

導入數據:(已完成)

下載了MySQL Front(MF)之後,發現workbench也很好用,所以都留下來了。MF的下載也非常簡單,開源的都很好,還是中文版的。

是的,在使用QGEN之前要先安裝數據庫,然後在數據庫中新建一個數據庫,如果想要使用上面提到的那個測試腳本,有些參數在新建數據庫時就要跟它保持一致。例如:數據庫名:tpch(must)。

 

依然是參考DBGEN使用的同一個博客 windows :TPC-H測試的數據庫模式生成及其數據導入MySQL的教程記錄 - CSDN博客

https://blog.csdn.net/w_bu_neng_ku/article/details/68953335後面的部分,這裏使用的是Workbench,在下載MySQL的時候就已經順手勾選下好了,所以可以直接用【開心(*^▽^*)。

接下來就是數據導入數據庫了。

直接在Query裏執行創建數據庫表結構,使用博客裏給的sql語句。出現 Error Code 1046: No database Selected the default DB to be used ...解決方案,在create table 前加上一句use tpch(數據庫名);。(txt已更新,sql文件已保存:tpch_tbl.sql)

表結構的創建就完成了。下面創建表約束條件:使用博客裏的sql語句創建約束條件。博客裏的語句關於外鍵的都是不對的,正確的外鍵格式:

ALTER TABLE 數據表名

ADD CONSTRAINT 外鍵別名 FOREIGN KEY (字段1.1,字段1.2,...,字段1.n) REFERENCES 表名(字段2.1,字段2.2,...,字段2.n);

更改後保存到txt文件,同時保存了sql文件:tbl_constraint.sql。

導入數據依舊是參考博客sql語句。導入數據需要點時間,而且還有warning。

只有PART和REGION裏有數據,應該是失敗了?

2018/7/19

解決方法,根據外鍵關聯順序,先執行無關聯只含主鍵的表,然後執行外鍵關聯已含數據的數據庫表。

圖:tpch數據庫模式

  1. 其中Nation和Region數據量與SF無關;
  2. Nation是固定25,Region的5不是必然;
  3. LineItem的數據量是不嚴格的SF倍數。

然後在導入lineitem表時,用了一個多小時還是失敗了。再試一次唄。其中一個博客說導入時長根據個人電腦,他的用了20+分鐘,另一個說用了幾分鐘【白眼

插播:並沒有失敗,使用select count(1) from tpch.lineitem;查看錶行數返回值是6001215,lineitem本就是一個與SF無關的大概在6000k*sf的數量,所以就不重新導入了,下次再測試導入時注意一下就可以了。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章