【NOSQL】非關係型數據庫MongoDB ( MongoDB索引用法和效率分析 )

MongoDB中的索引其實類似於關係型數據庫,都是爲了提高查詢和排序的效率的,並且實現原理也基本一致。由於集合中的鍵(字段)可以是普通數據類型,也可以是子文檔。MongoDB可以在各種類型的鍵上創建索引。下面分別講解各種類型的索引的創建,查詢,以及索引的維護等。

一、創建索引

   1. 默認索引

  MongoDB有個默認的“_id”的鍵,他相當於“主鍵”的角色。集合創建後系統會自動創建一個索引在“_id”鍵上,它是默認索引,索引名叫“_id_”,是無法被刪除的。我們可以通過以下方式查看:

1
2
var _idIndex = mongoCollection.Metadata.Indexes.Single(x => x.Key == "_id_");
Console.WriteLine(_idIndex);

   2. 單列索引

  在單個鍵上創建的索引就是單列索引,例如我們要在“UserInfo”集合上給“UserName”鍵創建一個單列索引,語法如下:(1表示正序,-1逆序)

1
mongoCollection.Metadata.CreateIndex(new Document { { "UserName", 1 } }, false);

  接着,我們用同樣方法查找名爲“_UserName_”的索引

1
2
var _UserName_Index = mongoCollection.Metadata.Indexes.Single(x => x.Key == "_UserName_");
Console.WriteLine(_UserName_Index);

   3.組合索引

  另外,我們還可以同時對多個鍵創建組合索引。如下代碼創建了按照“UserId”正序,“UserName”逆序的組合索引:

1
mongoCollection.Metadata.CreateIndex(new Document { { "UserId", 1 }, { "UserName", -1 } }, false);

   4.子文檔索引

  我們可以對文檔類型的鍵創建各種索引,例如單列索引,如下創建用戶詳細信息“Detail”的單列索引:

1
mongoCollection.Metadata.CreateIndex(new Document { { "Detail", 1 } }, false);

  對子文檔的鍵創建組合索引:例如在“Detail.Address”和“Detail.Age”上創建組合索引:

1
mongoCollection.Metadata.CreateIndex(new Document { { "Detail.Address", 1 }, { "Detail.Age", -1 } }, false);

   5.唯一索引

  唯一索引限制了對當前鍵添加值時,不能添加重複的信息。值得注意的是,當文檔不存在指定鍵時,會被認爲鍵值是“null”,所以“null”也會被認爲是重複的,所以一般被作爲唯一索引的鍵,最好都要有鍵值對。

  對“UserId”創建唯一索引(這時候最後一個參數爲“true”):

1
mongoCollection.Metadata.CreateIndex(new Document { { "UserId", 1 } }, true);

二、維護索引

   1. 查詢索引

  通過索引名查詢的方式已有介紹。但有時候,我們可能忘記了索引名,怎麼查詢呢?

  下面提供一個遍歷全部索引的方法,打印全部索引信息:

1
2
3
4
foreach (var index in mongoCollection.Metadata.Indexes)
 {
     Console.WriteLine(index.Value);
}

  輸出結果示例:

1
2
3
4
5
6
{ "name": "_id_", "ns": "myDatabase.UserInfo", "key": { "_id": 1 } }
{ "name": "_UserId_unique_", "ns": "myDatabase.UserInfo", "key": { "UserId": 1 }, "unique": true, "_id": "4d8f406ab8a4730b78000005" }
{ "name": "_UserName_", "ns": "myDatabase.UserInfo", "key": { "UserName": 1 }, "unique": false, "_id": "4d8f406ab8a4730b78000006" }
{ "name": "_Detail.Address_Detail.Age_", "ns": "myDatabase.UserInfo", "key": { "Detail.Address": 1, "Detail.Age": -1 }, "unique": false, "_id": "4d8f406ab8a4730b78000007" }
{ "name": "_UserId_UserName_", "ns": "myDatabase.UserInfo", "key": { "UserId": 1, "UserName": -1 }, "unique": false, "_id": "4d8f406ab8a4730b78000008" }
{ "name": "_Detail_", "ns": "myDatabase.UserInfo", "key": { "Detail": 1 }, "unique": false, "_id": "4d8f406ab8a4730b78000009" }

  可見,集合的索引也是通過一個集合來維護的。name表示索引名,ns表示索引屬於哪個庫哪個集合,key表示索引在哪個鍵上,正序還是逆序,unique表示是否爲唯一索引,等等...

   2. 刪除索引

  新手常陷入的誤區是,認爲集合被刪除,索引就不存在了。關係型數據庫中,表被刪除了,索引也不會存在。在MongoDB中不存在刪除集合的說法,就算集合數據清空,索引都是還在的,要移除索引還需要手工刪除。

  例如,刪除名爲“_UserName_”的索引:

1
mongoCollection.Metadata.DropIndex("_UserName_");
    下面提供刪除除默認索引外其他全部索引的方法:
1
2
3
4
5
6
7
8
9
10
11
public void DropAllIndex()
{
    var listIndexes = mongoCollection.Metadata.Indexes.ToList();
    for (int i = 0; i < listIndexes.Count; i++)
    {
        if (listIndexes[i].Key != "_id_")
        {
            mongoCollection.Metadata.DropIndex(listIndexes[i].Key);
        }
    }
}

三、索引的效率

  MongoDB的索引到底能不能提高查詢效率呢?我們在這裏通過一個例子來測試。比較同樣的數據在無索引和有索引的情況下的查詢速度。

  首先,我們通過這樣一個方法插入10W條數據:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
public void InsertBigData()
{
    var random = new Random();
    for (int i = 1; i < 100000; i++)
    {
        Document doc = new Document();
  
        doc["ID"] = i;
        doc["Data"] = "data" + random.Next(100000);
  
        mongoCollection.Save(doc);
    }
  
    Console.WriteLine("當前有" + mongoCollection.FindAll().Documents.Count() + "條數據");
}

  然後,實現一個方法用來創建索引:

1
2
3
4
public void CreateIndexForData()
{
    mongoCollection.Metadata.CreateIndex(new Document { { "Data", 1 } }, false);
}

 還有排序的方法:

1
2
3
4
public void SortForData()
{
    mongoCollection.FindAll().Sort(new Document { { "Data", 1 } });
}

 運行測試代碼如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
static void Main(string[] args)
{
    IndexBLL indexBll = new IndexBLL();
    indexBll.DropAllIndex();
    indexBll.DeleteAll();
    indexBll.InsertBigData();
  
    Stopwatch watch1 = new Stopwatch();
    watch1.Start();
    for (int i = 0; i < 1; i++) indexBll.SortForData();
    Console.WriteLine("無索引排序執行時間:" + watch1.Elapsed);
  
    indexBll.CreateIndexForData();
  
    Stopwatch watch2 = new Stopwatch();
    watch2.Start();
    for (int i = 0; i < 1; i++) indexBll.SortForData();
    Console.WriteLine("有索引排序執行時間:" + watch2.Elapsed);
  
}

  最後執行程序查看結果:

  

  多次測試表明在有索引的情況下,查詢效率要高於無索引的效率。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章