一名荷蘭大哥對 De novo 的研究。(尤其是Sherenga的

Sherenga 參考文獻[20][21][22]

3.1 準備光譜圖

3.1.1 點

圖的節點是表示部分肽的潛在質量的整數值。
這些是通過將每個峯值s∈S轉換爲k個節點而獲得的:V(s)= {s +δ1,…,s +δk}。
峯值是指該峯值所代表的質量值(即該值的值)
x軸),而不是峯的強度(或y值)。 如果我們談論強度,那麼
這明確地稱爲峯值強度。 考慮到簡化
只有N端離子我們才能用公式來計算質量
寫下特定部分肽的離子類型(第2.5節)如下:

m(δ-ion) = m(Pi) − δ (3.1)

由於光譜S中的峯代表這些碎裂離子的質量,
我們可以把公式寫成: m(Pi) = sj + δ

其中sj是來自光譜的峯,其對應於部分肽Pi的δ-離子。
因此,測得的離子質量值減少到氨基酸的總和
這個質量是由什麼組成的(參見符號2.5),也稱爲殘餘質量。

爲了使這種比較有效,δ當然必須具有離子類型的值峯值sj,我們想要得到非電離相應部分的質量值肽。由於我們不知道哪種離子類型代表某個峯值,因此是不可能的每次使用正確的δ來計算節點。因此,爲此在某個峯值s,每個δ都有一個節點。這導致光譜S在大量節點中,實際上只有形成有正確δ的節點表示與峯相關的部分肽。但也可能是其他節點碰巧具有可能的部分肽的實際質量值。這些都是所謂的
假結。請注意,我們尚未考慮測量中的不準確性可能會導致錯誤結的質譜儀。各方面有關不準確的測量結果將在後面的3.5節中討論。
具有m個峯值的頻譜的完整節點集由下式給出:
{sinitial}∪V(s1)∪…∪V(sm)∪{sf inal}(3.4)
這裏sinitial = 0和sfinal = m(P),其中m(P)是母離子的質量。對於二價帶電碎片離子,我們必須考慮到這一事實光譜中的數據不代表質量,但確實代表質量/負荷。實際的因此,具有二價帶電碎裂離子的質量是峯值的兩倍秒。爲了找出非離子化的N-末端部分肽的質量(因此,要確定節點),必須稍微改變公式:
m(Pi)= 2si +δ(3.5)
如果光譜包含單電荷和二價電荷離子,則建立節點通過應用公式3.3和3.5。一價帶電離子的公式變爲應用表示單價帶電離子類型的集合Δ的子集。該對於二價帶電離子的公式應用具有二價帶電的δ值離子類型。

3.1.2 邊

如果差值爲v-u,則兩個節點u和v通過從u到v的有向弧連接是氨基酸的質量。然後用該氨基酸標記電弧。所以我們有有針對性的計數。由於氨基酸的質量嚴格爲正,因此電弧永遠不會返回值較小的節點。這使得計數非週期性。

由於我們假設我們只能處理N端離子的簡化從u到v有這樣一個弧,即v的序列1可以通過獲得用一個氨基酸延長你的序列,即用氨基酸弧被標記。我們將看到通過這種方式可以形成一條路徑計數。

一旦繪製了弧,就可以確定光譜圖的硝化形狀。所有無法到達的節點,無法從哪個節點到達Sfinal的節點從計數中刪除。如果他們仍然是計數的一部分,那麼就會路徑永遠不會陷入這樣的結或永遠不會擺脫它。這些點是找到從Sinitial到Sfinal的路徑毫無意義,因此被刪除

3.1.3 頻譜圖中的路徑

如果光譜S完整,即,每個可能的部分肽Pi光譜以至少一種離子類型的形式存在,然後在GΔ(S)中存在一條路徑從長度n從Sinitial到Sfinal,用肽P標記(由n個氨基酸組成)

本聲明基於觀察,文獻[20] [21] [22]沒有提供證據,但直覺上這句話是正確的。 因爲完整性,所以有可能N-末端部分肽是譜圖中存在的節點。 對於親本肽由n個氨基酸組成,因此這些n – 1個節點對應於N末端部分petids P1到Pn – 1.因此可以使用弧的屬性來完成如果一個人遵循圖中的正確路徑,則重建原始父肽。 整體而言過程如圖3.1所示。 找到的路徑位於下圖中藍色和大膽。 肽測序問題現在已經減少到發現目標非循環圖中的正確路徑。

我們在圖中看到,計數中還有其他路徑。 所有這些路徑都成了受評分算法的影響。 指示的路徑是得分最高的路徑。第3.7節解釋了這一點。

3.1.4示例

在我們放棄所有簡化之前,我們首先給出一個簡單的例子
制定頻譜圖。我們總結了所做的假設:

來自光譜的峯代表N-末端,有價值的離子;
常見的離子是b離子和b-H2O離子,相當於集合 set ∆= {-1, 17};
頻譜 頻譜完整;
質譜儀的測量結果沒有錯誤。

設S是有問題的(有效)實驗光譜。表3.1顯示了這方面的數據
譜。由於在頻譜圖中我們沒有考慮到強度
峯值,這些從表中省略。我們可以讀到父質量等於520.25
Da和該父質量的負荷爲+1。我們首先計算m(P)的值:
測量值520.25 Da = m(P)+ m(H)+ m(OH)+ m(電荷)= m(P)+ 1 Da + 17 Da + 1 Da。
由此得出m(P)= 501,25Da

(包含所有節點和弧的頻譜圖

計算節點

我們根據V(s)= {s +δ1,s +δ2}計算節點集,δ1= -1,δ2= 17

我們在點集合中看到節點s42的值等於節點s51的值。僅爲此值創建一個節點。 該值意味着所討論的部分肽發生在光譜中出現的兩個(在該示例中爲全部)離子類型中

既然結已經確定,我們可以畫出弓箭。圖3.2顯示了頻譜圖再次使用所有計算的節點和可能的弧。這樣讀者就可以輕鬆搞定要與按鈕組進行比較,對應於第一個= =鈭鈭的按鈕顯示在圖形的頂部,其他節點顯示在底部。剛剛提到的點值272.11顯示在中間。圖3.3顯示了沒有節點的計數和邊,不能完全包括在計數中。我們在最後的計數中看到了這一點從sinitial到sfinal有兩條可能的路徑。 AGSGTK和QSGTK序列他通過伯爵的路徑。確定哪個序列識別頻譜尋找最長的路徑。最長的路徑是對應於肽P的路徑最好地解釋了頻譜[20]。在該實施例中,AGSGTK是譜S的肽
已經產生了。我們現在不會進一步討論這個問題。在3.7節中,我們將看到那裏
每個節點都給出一個分數。在這些分數的基礎上,得分找到路徑計算。得分最高的路徑是所謂的最長路徑。

有針對性的非循環計數中最長的路徑是理論計算機科學中的已知問題,
並且可以通過快速,線性時間動態算法來解決[23]。我們將看到(第3.8節)遺憾的是,該算法無法在實踐中應用。甚至找到的最長路徑並不總能顯示正確的標識(第4章)。就這個但是,目前我們不必擔心這一點,我們認爲它會存在一種算法來查找譜圖中最長的路徑。我們爲這個例子做了相當多的簡化,並且有一個用少量正確數據鑑定MS / MS譜。下一節經歷了所有的簡化,並引用了Sherenga用於此的解決方案。從第3.2節詳細討論了這些技術。通常有幾條最長的路徑發現,製作必要的評分算法(第3.7節)。最後(第3.8節)來了跟蹤通過頻譜圖的路徑的算法。

3.1.5 缺點

3.1.6 概述

上述解決方案的缺點將在起草計數之前,期間和之後進行。 爲了不混淆讀者,首先是一個圖表。繪製光譜圖的概述在實踐中如何完成(沒有簡化)。 未知的概念將在下一節中進行廣泛討論是。讀者總是可以參考這個圖來定位所描述的技術。第一步到第四步確定圖的節點。 第五步和第六步邊。此時不符合3.1.2節描述的所有節點和弧都不是最終頻譜圖的一部分。 最後,通過計數的路徑確定並計算他們的分數。
1.偏移頻率功能:確定設定值Δ
2.強度閾值
3.重新計算母體質量的C-末端離子
4.合併算法
5.弧
6.間隙和橋邊
7.搜索路徑和評分算法

3.2 頻率偏移函數

我們在開始時做出的一個假設是知道集合Δ,即離子在待鑑定的實驗光譜中出現的類型。 自此設定正如每個質譜儀都不同,從頭算法通常都是特定的質譜儀。 然而,Sherenga具有可以確定哪種離子類型的功能由特定的質譜儀產生。 這允許算法不用問題適用於所有類型質譜儀的數據。 唯一的要求是一套訓練集。 訓練集是一組識別的實驗光譜,在這種情況下來自質譜儀,其中確定了集合Δ。

3.2.1 基礎

從訓練集開始,可以瞭解該集。 一旦知道這個集合人們可以繼續使用它來建立頻譜圖和未知序列,用這種質譜儀分析後得到。 我們追求簡單仍然值得在N端碎片離子上獲得不錯的電荷。給定P和St,來自訓練集的St one頻譜和識別該頻譜的P,
我們定義偏移量Offset

                    xij = m(Pi) − sj        (3.6)

和準確度 ε,通常等於0.5。 Pi設置N端部分已知序列P的肽 可以計算這些部分肽的質量使用附錄C中的表格。光譜的質量值變爲St. 由sj建議。

3.2.2 OFF偏移頻率函數

在這裏插入圖片描述

偏移表示可能的離子類型,因此訓練集中出現的δ值。
如果我們比較公式3.3和3.6,這很容易看出。 H的值只不過是光譜中存在的δ= x類型的離子數。
對應於在光譜中出現的離子類型的δ值的x值的H值將遠大於在任意x值上的H值。 對於x的隨機值,由於頻譜中存在噪聲,函數H仍將具有大於零的值。 然而,與x的“實際”δ值的計數相比,這些值可忽略不計。 如果我們將函數H繪製爲x的函數,則在x值上對應於當前離子類型的δ值
清晰的峯值是可見的。 圖3.4和3.5就是這方面的例子.
表3.2:示例:使用偏移頻率函數從訓練集獲得的數據[20]
表3.2:示例:使用偏移頻率函數從訓練集獲得的數據[20]
偏移頻率函數僅僅是訓練集的所有頻譜St上的函數H的總和。 通過使用多個光譜,常見離子類型的峯值將加在一起,使它們更加明顯。 對於不太常見的離子類型,較小的峯將與噪聲峯值成比例地變大(它們更隨機,因此不一定在不同的光譜中產生相同的偏移),這也使得更容易區分這些離子類型。 應用偏移頻率函數的結果如表3.2所示。 除x值(整數偏移)外,該表還顯示實際測量的偏移量。 除了針對給定x(計數)找到的離子數量外,該表還包含有關離子類型的信息以及它是否涉及N端或C端離子。 如何獲得C-末端離子的值在3.4.2節中討論。

只有與某些計算的偏移相對應的計數值纔是由偏移頻率函數產生的數據。已添加其他信息,並且是與所討論的整數o集匹配的已知數據。該表還包含兩個二價帶電離子y2和y2-H2O的數據。我們稍後會回到這裏。
圖3.4(a)顯示了該實施例的N-末端部分肽(帶電荷1)的離子類型的圖。圖中顯示了許多峯。在這裏,我們清楚地看到不同離子類型和噪聲峯值之間的強度差異。爲完整起見,C末端部分肽的圖也顯示在圖3.4(b)中。引人注目的是y離子的顯着存在,以及僅發現了兩種其他離子類型的事實,與N端部分肽的各種離子類型相反,這立即解釋了爲什麼算法,如Sherenga,作爲簡化,接受對N端離子或僅對b和y離子的限制。

[此處有 四個 N端C端  離子的圖]
在這裏插入圖片描述
對於具有二價電荷的離子,函數H(x,St)被轉換爲:H +2(x,St),其中xij = m(Pi)-2sj。 圖3.5(a)和(b)分別顯示了具有二價電荷的N-末端和C-末端離子的偏移頻率函數。 我們清楚地看到了
質譜儀中使用的電離法主要產生一價帶電離子,表3.2中的離子y2和y2-H2O表示二價帶電離子的測量結果。 對於更高的負載,我們的工作類似。

表格和圖表都清楚地顯示了使用的離子類型質譜儀。 由於偏移頻率功能,我們有這個離子類型可以很容易地根據算法找出訓練集Sherenga機器已經獨立。 現在可以進一步使用找到的組Δ確定計數。

僞代碼:
對於訓練集中的所有光譜S.
    對於所有部分N - 末端離子
        對於所有x,用整數值變化
            計算H(x,S);
            H(x)= H(x)+ H(x,S);
    對於所有部分C - 末端離子
        對於所有x,用整數值變化
            計算H(x,S);
            H(x)= H(x)+ H(x,S);

3.3 閾值設置

光譜中的峯具有不同的強度。 然而,在這樣的光譜中也存在一定量的噪聲。 可以設置閾值以區分這兩者。 但是,選擇閾值並不明顯。 如果閾值太低,則會導致頻譜圖的極端增長。 另一方面,如果它們太高,我們將無法再完全建立頻譜圖。 如果考慮的峯值太少,可能會丟失許多相關信息,並且可以在頻譜圖中繪製不足的拱門。 這意味着計數中可能出現“漏洞”,因此無法找到路徑。

強度閾值的確定不僅發生在該算法中。 大多數算法已經放棄了一個全局閾值的想法並使用局部閾值。 然而,Sherenga使用設定頻率函數並基於實驗確定的事實確定強度閾值:光譜中峯的強度與離子類型有關。 例如,我們知道b和y離子是最常見的。 當然,代表b或y離子的峯強度將大於其他離子類型的峯強度。 Sherenga開發了一種根據所討論的離子類型以非常特定的方式確定閾值的方法。

爲了找出哪種離子類型出現在哪種強度中,我們繼續使用訓練集和偏移頻率函數。給定光譜St,峯值根據其強度分組在大小爲K =(parentMass)/ 100的區間中。具有最高強度的K峯值接收秩1,接下來的K峯值等級爲2,等等。通過將其應用於來自訓練集的光譜,已經注意到偏移頻率函數(取決於等級)是非常有趣的過程。展品。離子類型主要出現在幾個連續的等級中,但是一旦偏移頻率函數達到較低的等級,圖形就會非常快地下降,這意味着離子類型在這些較小的強度中不會發生太多。因此,峯的等級或強度與相應的離子類型之間存在明確的關係。 Sherenga將使用此鏈接來使用更好的閾值。由於偏移頻率函數適用於來自訓練集的所有光譜,因此所有這些光譜被分成區域,使得關於離子類型和等級之間的關係的數據也可以從所有光譜中使用。

3.3.1偏移頻率功能根據等級

圖3.6顯示了N端,單價帶電離子的每個等級i的相應偏移頻率函數(我們仍然使用相同的例子)。 圖的上半部分顯示了等級≥i的離子的偏移頻率函數,等級爲<i的離子的下部。 在該圖中,我們可以看到,在等級低於5的強度下,此偏移頻率函數(上部)幾乎沒有峯值。 這意味着在光譜中接收到低於5的等級的峯對偏移頻率函數的離子類型的計數幾乎沒有貢獻。 這些峯值很可能不代表數據而是噪音。 因此,我們可以將頻譜圖的節點限制爲從1到5級的峯值。

3.3.2離子類型和強度之間的關係

從圖中我們還可以推斷出哪些等級的離子類型。 圖的下半部分可以考慮如下。 以圖(b)爲例,其中下部表示高於2的等級的偏移頻率函數,或偏移頻率函數限制爲1級。類似於下圖(c),其中偏移頻率函數限於等級 一,二。

爲了確定在哪個等級中出現哪種離子類型,我們將查看某個等級對圖表下部峯值的貢獻。 我們將以離子類型b和b-H2O爲例(這些峯值在圖中表示)。 這類似於所有其他N端離子類型。 我們對C端離子的工作方式相同,但當然還有C端離子的設定頻率函數

對於b離子,我們看到下圖中的峯值在圖(b)到(d)上急劇增加。 對於圖(b),我們可以在下圖中形成峯值的“增長”,如下所示:在等級爲1的峯值下計算的b離子數量。大的增加意味着在第一,第二和第三等級中 光譜中存在許多b離子。 從圖(e)可以看出,如果我們將增加與之前的圖表進行比較,那麼峯值幾乎不會增加。 因此,來自四級光譜的峯不再含有許多b離子。 爲了建立頻譜圖,我們將僅計算一級,二級和三級的峯值s的節點,其中δ= -1,這對應於b-離子的δ。

如果我們對離子型b – H2O做同樣的事情,我們會得到不同的結果。 在圖(b)的下半部分,我們看到這種離子類型只有非常小的偏移頻率函數值。 我們故意不把這稱爲峯值,因爲沒有峯可以與周圍的噪聲區分開來。 在圖(c)中只能看到一個小峯。 然而,從圖(d)可以看出,該離子類型的峯值明顯增加。 因此,我們可以說,等級中的峯特別代表b – H2O型的三個,四個和五個離子。 該方法很大程度上取決於來自訓練集的光譜質量,並且在判斷等級和離子類型之間的關係時或多或少是主觀的。 然而,這種工作方式比該領域的例外更爲規則,因爲由於當前質譜儀的限制,不可能回退到精確數據。

—4偏移值(或δ值)顯示在水平軸上。 對於b離子,這是相同的
到-1。

[此處應該有8個圖]

3.3.3頻譜圖的優缺點

在確定強度閾值後,我們可以通過首先僅將屬於1到5級的峯轉換爲節點來建立頻譜圖。然後根據離子類型應用閾值。我們現在考慮從我們想要轉換成節點的光譜中得到的峯值。假設這個峯值屬於第二等級。然後我們現在知道我們必須添加對應於b離子的δ值,而不是對應於b – H2O離子的δ值。我們類似地爲所有其他離子類型工作。這樣,可以避免頻譜圖中的許多不必要的節點。一級峯值對應b – H2O離子的可能性非常小。因此,沒有必要使用最可能不代表真實部分肽的質量的節點使圖過載。這些節點將不包括在計數中,或者可能導致錯誤的節點和/或弧。當然不建議在圖表中包含不正確的數據,並且儘可能避免這種情況。另一方面,該方法的缺點在於,如果特定的片段化離子(例如b2離子)在光譜中不足,則相應的部分肽也不會出現在圖中。在該示例中,我們將b離子限制爲等級1,2和3.例如,代表性不足的b2離子將僅出現在5級並且將以這種方式丟失。

3.4 C端離子

到目前爲止,我們一直認爲我們只使用N端離子。 然而,真實光譜包含N端和C端離子。 前面已經提到過,C-末端離子向N-末端離子的轉化並不那麼明顯(3.1節)。 本節將解釋頻譜圖必須經歷的調整。 我們忘記了偏移頻率函數和強度閾值爲我們提供的信息,並假設光譜僅包含b和y離子。 所以我們不對等級進行區分,我們只會區分δ值。 對應於N-末端離子和C-末端離子。 3.4.2和3.4.3節將解釋偏移頻率函數和強度閾值的信息如何與C端離子結合。

3.4.1 C端離子的節點

首先,我們不知道哪個峯對應於N-末端,哪個峯對應於C-末端離子。這是一個問題,因爲我們可以通過假設只有N端離子輕鬆找到通過圖的路徑。因此,首先將每個峯視爲N-末端離子,然後將其視爲互補的C-末端離子。Zij是光譜的峯值,m(P)是母質量。我們首先將峯值s視爲b-離子,並且已經知道這將導致形成具有質量值s +δb= s -1的節點,即由s表示的離子的殘餘質量。如果我們然後將峯值視爲y離子,我們希望將該離子轉換爲表示互補b離子的殘餘質量的節點作爲值。爲此,形成具有質量值m§ – (s +δy)= m§ – (s-19)的節點。因此,光譜中存在的每個離子都由正確和錯誤的部分組成
在光譜中添加了肽。這個錯誤的結被稱爲假雙胞胎頂點。爲了說明這一點,我們提供了一個理論示例。

設HA1A2A3A4A5OH代表親本肽,其中Ai爲氨基酸殘基
肽。 m(P)代表氨基酸質量的總和,因此等於A1A2A3A4A5的質量。有兩種選擇;所討論的峯代表b離子或y離子。我們知道H分子的重量爲1 Da,O分子的重量爲16 Da。

我們看到還爲每個節點創建了一個假的雙頂點。不幸的是,我們不知道哪兩個節點是正確的,哪個是僞雙頂點。讀者將被注意到
假雙胞胎頂點不代表氨基酸總和的質量,但該節點18 Da太重。因此,人們會認爲這些節點無論如何都不在路徑中
將被包括在內。不幸的是,可以發現許多氨基酸的質量相差18Da,即使耐受性小於0.5Da。舉個例子
脯氨酸(P)和天冬氨酸(D),質量相差18.3 Da。使用允許的容差在計算節點和弧時,以及測量結果中的不準確性時,這些節點不再是無意義的數字,而是包含與原始序列中不同的氨基酸的氨基酸序列。沒有太多的努力,你可以在假雙胞胎頂點之間繪製拱門,也可以在正確的節點和僞雙頂點之間繪製拱門。通過計數的路徑,其具有相同峯值的正確和錯誤節點
當然不能成爲親本肽的良好標識符。在起草計數期間,因此創建包含這些禁止對的列表。我們需要我們
重新制定最長路徑問題:

目標非循環計數中具有一組禁用對的最長路徑。
然而,這是一個NP難問題[24],這意味着它不能在多項式時間內解決
可以。人們如何對可行算法進行了廣泛的討論
第3.8節和第4章。
3.4.2 De offset frequentie functie voor C-terminale ionen
3.4.3 Intensiteitsthresholds en C-terminale ionen
3.5 邊
3.6 Parent Mass
3.7 打分函數

如果在譜圖中發現了幾條“最長路徑”,那麼必須有辦法確定這些路徑中的哪一條或這些候選肽中的哪一條最能“解釋”實驗譜。 正在爲此開發概率模型。 首先確定如何給每個節點分數。 然後,我們看看如何根據這些分數評估找到的路徑。
3.7.1定義和符號

在我們深入研究概率模型之前,我們首先給出一些我們將使用的符號和定義。

設P爲肽,S爲光譜。 然後我們將p(P,S)定義爲肽的概率
P產生了光譜S. 我們現在可以按如下方式制定評分路徑問題:
找到對於給定光譜S p(P,S)最大的肽P.
換句話說,如果在頻譜圖中找到了許多路徑,請在此處找到它
p(P,S)最大的路徑(即肽)。

我們現在熟悉屬於某個質譜儀的離子類型組Δ= {δ1,…,δk}。 這些離子類型中的一些將比其他類型更頻繁地發生,反之亦然。 這就是爲什麼我們注意到離子類型δi爲p(δi)的概率。 以與其他δs的概率無關的概率p(δi)產生部分肽的δi離子。

最後,還必須表示質譜儀產生的噪聲。 質譜儀可以在光譜中的任何位置產生具有概率qR的噪聲峯值。

我們現在可以說,在與δi離子對應的位置出現峯值,
生成的概率qi等於:qi = p(δi) + (1 − p(δi)) ∗ qR (3.8)

用語言來說:峯值出現在光譜中與離子類型相對應的位置的概率等於質譜儀中出現這種離子類型的概率(p(δi))+這種離子類型不發生的概率(1-p(δi))乘以噪聲概率。
p(δi)的值可以從觀察到的訓練集的經驗分佈估計(見表3.2)。
理論上,部分肽可以在光譜中具有最多k個相應的峯;
每種離子類型一個峯。 所有這些k峯爲部分肽的概率(即
來自集合 的所有離子類型也有效地存在於頻譜中,等於:

3.8 路徑

最後,我們將討論如何在圖中查找路徑。 頻譜圖是有針對性的非循環圖。 一旦圖建立,我們就可以表達肽序列問題如下:

找到有向無環圖中的最長路徑
GAG中的最長路徑算法是理論計算機科學中衆所周知的問題。 這已知是一種快速,線性時間動態算法,這是該方法與頻譜圖的一個非常大的優勢[23]。 不幸的是,該算法在實踐中不起作用,例如, 假雙胞胎頂點。

3.8.1假雙胞胎頂點

在關於C端離子的3.4.1節中,我們已經提到了僞雙頂點的問題。 因爲光譜S中的每個峯被解釋爲N端離子而且還被解釋爲C端離子,每個“真實”節點(對應於質量m)具有所謂的僞雙頂點,其質量爲m(P) – m偏移處。 這導致如下問題:如果真實節點達到高分,則假節點也將獲得高分。 因此,最長路徑算法通常包括最長路徑中的實節點和假節點。 這些途徑不能代表合理的肽序列,因此可以最好地避免。 所以我們必須稍微調整算法。
令G爲圖形,並且讓T爲來自G的一組禁止節點,即僞雙頂點。如果G中的路徑最多包含每個禁止對的一個節點,則稱其爲反對稱。
這正是我們想要實現的目標。 肽序列問題現在聽起來如下:

用一組禁用對T找到G中最長的反對稱路徑
我們剛剛給出了假雙胞胎頂點問題的解決方案,不幸的是我們現在遇到了NP難問題[24] [25]。迄今爲止,還沒有找到解決反對稱最長路徑問題的有效算法。然而,這不是一個負面結果。由於被禁止的夫婦的特殊結構,在這種特定情況下可以有效地解決方案。該結構如下。

如果間隔(x1,y1)和(x2,y2)是非交織的,則兩個禁止對(x1,y1)和(x2,y2),xi <yi被稱爲非交織[20]。這意味着(x1,y1)的間隔
完全覆蓋區間(x2,y2),反之亦然。如果我們根據大小對節點進行排名,則應該如下所示:[x1,x2,y2,y1]或[x2,x1,y1,y2]。因爲被禁止
對是質量互補的(相對於父質量):x1 + y1 = x2 + y2。由於這個特性,每兩對互補節點(或禁止對)是非交叉的。
我們首先證明這對符合某些特徵的兩對: 證明過程略;
因此,頻譜圖的每兩對互補節點是非交叉的。
如果每兩個禁止對是非交織的,則將具有一組禁止對T的圖G指定爲合適的[20]。
現在,反對稱最長路徑問題在合適的圖中被簡化爲反對稱最長路徑問題。在關於Sherenga [20]的文獻中,聲稱情況就是如此存在有效的算法。但是,作者沒有描述它。其他人在上面描述的算法將在下一章中討論。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章