RapidMiner 數值調整

這裏寫圖片描述
一、調整日期


//概述
通過添加或減少指定的時間量,調整指定列的日期。

//描述
通過在任意單元給屬性值添加一個恆定值作爲天,小時或秒,這個操作符允許調整日期屬性。

//輸入
example set input: 期望 : 實例集元數據: #examples: = 0; #attributes: 0

//輸出
example set output:
original:

//參數
attribute name: 應該解析的屬性。
adjustments: 該列表定義所有的日期調整。
keep old attribute: 表示是否保持原有的日期屬性。

二、映射


//概述
將一個指定的屬性值映射爲其它值。

//描述
這個操作符把ExampleSet作爲輸入,並把某種屬性的值映射到其它值。這個操作符能更換標稱值(如通過"green_color"更值"green")和數值(如通過“-1”更換所有值“3”)。使用參數replace_what和replace_by可以指定一個單一的參數。在參數列表value_mappings中可以指定對個參數。

此外,此操作符允許定義(並考慮)一個默認的映射。如果add_default_mapping被設置爲真,並且default_value 被正確的設置,在實例集中存在但沒有在值映射列表中列出的所有值將被缺省值取代。

在如下情況很有用,僅一些值應該被明確的映射和一些不重要的值應該被映射爲缺省值(例如,“other”)。
如果參數consider_regular_expressions啓用,如果原始值與給定的正則表達式匹配,新值替換原始值。

該值與第一次匹配的在映射列表中作爲代替者的正則表達式相一致。
對於屬性名稱,此操作符支持正則表達式,即映射值被應用於名稱滿足名稱表達式定義的模式的所有屬性。

//輸入
example set input: 期望 : 實例集元數據 : #examples: = 0; #attributes: 0

//輸出
example set output:
original:

//參數
attribute filter type: 條件指定該操作符選擇或影響哪些屬性。
attribute: 應選擇的屬性。
attributes: 應選擇的屬性。
regular expression: 屬性名保持不變的正則表達式。
use except expression: 如果啓用,指定正則表達式的異常可能被指定。雖然匹配第一個表達式,但匹配這個的屬性將被過濾。
except regular expression: 雖然匹配上述正則表達式,但屬性名正則表達式應該被過濾。
value type: 屬性的值類型。
use value type exception: 如果啓用,指定值類型的異常可能被指定。雖然匹配第一個指定的類型,但該類型的屬性將被過濾。
except value type: 該值類型除外。
block type: 屬性的塊類型。
use block type exception: 如果啓用,指定塊類型的異常可能被指定。
except block type: 該塊類型除外。
numeric condition: 條件的參數字符串,如 '>= 5'
invert selection: 表示是否只接受通常被過濾掉的屬性。
include special attributes: 表示是否該操作符也適用於特殊屬性。否則,它們保持不變。
value mappings: 值映射。
replace what: 該值的所有出現將被替換。
replace by: 使用的新屬性值。
consider regular expressions: 基於正則表達式的有效匹配;原始值可能被指定爲正則表達式。
add default mapping: 如果設置爲真,在值映射列表中沒有列出的原始值被映射爲默認值。
default value: 所有原始值被映射的默認值,在 add_default_mapping 設置爲真的條件下。

三、合併


//概述
合併指定屬性的兩個標稱值。

//描述
合併一個給定的正則屬性的兩個標稱值。爲了處理如labels的特殊屬性,用AttributeSubsetPreprocessing 操作符打包此操作符,參數process_special_attributes 有效。

//輸入
example set input: 期望 : 實例集元數據 : #examples: = 0; #attributes: 0

//輸出
example set output:
original:

//參數
attribute name: 值應該被合併的標稱屬性名。
first value: 應合併的第一個值。
second value: 應合併的第二個值。

四、替換


//概述
該操作符替換標稱屬性的部分值。

//描述
這個操作符替換它所適用的所有標稱屬性的部分字符串值。屬性過濾器類型給出了限制它們的可能性。對於每個屬性的每個值,它檢查是否所替換的正則表達式與字符串匹配。字符串的每個相匹配的部分將被replace_what參數值替換。更換可能是空的,也可能包含捕獲組。 

請記住,雖然正則表達式比簡單字符串強大的多,但你可以僅輸入字符進行查找。

例子
這些屬性包含這些值"color red", "color green""color blue".
用"" 生成: " red", " green", " blue"替換"color""colour" 生成: "colour red", "colour green", "colour blue"替換"color""" 生成: "red", "green", "blue"替換 "color\s""_" 生成: "color_red", "color_green", "color_blue"替換 "\s+""$1" 生成: "red", "green", "blue"替換 "color\s(.*)""$1" 生成: "red", "green", "blue"替換 ".*\s(.*)"

//輸入
example set input: 期望 : 實例集元數據 : #examples: = 0; #attributes: 0

//輸出
example set output:
original:

//參數
attribute filter type: 該條件指定該操作符選擇或影響哪個屬性。
attribute: 應該選擇的屬性。
attributes: 應該選擇的屬性。
regular expression: 屬性名應保持的正則表達式。
use except expression: 如果啓用,指定正則表達式的異常可能被指定。雖然匹配第一個表達式,匹配這個的屬性將被過濾。
except regular expression: 雖然匹配上述正則表達式,但屬性名正則表達式應被過濾。
value type: 屬性的值類型。
use value type exception: 如果啓用,指定值類型的異常可能被指定。雖然匹配第一個指定的類型,但該類型的屬性將被過濾。
except value type: 該值類型除外。
block type: 屬性的塊類型。
use block type exception: 如果啓用,指定塊類型的異常可能被指定。
except block type: 該塊類型除外。
numeric condition: 條件的參數字符串,如 '>= 5'
invert selection: 表示是否接受通常被過濾的屬性。
include special attributes: 表示是否該操作符也應適用於特殊屬性。否則,它們保持不變。
replace what: 在屬性名中定義的應替換什麼的正則表達式。
replace by: 替換正則表達式匹配的部分。可能包括捕獲組。

五、設置數據


//概述
設置指定實例數據和屬性爲指定值。

//描述
這個操作符僅給指定的實例和給定值的屬性設置值。

//輸入
example set input: 期望 : 實例集元數據 : #examples: = 0; #attributes: 0

//輸出
example set output:
original:

//參數
attribute name: 應設置值的屬性名稱。
example index: 應設置值的實例的索引。從1開始計數。
count backwards: 如果選中,最後的計數順序被倒置,因此最後一個實例由索引1編址,倒數第二個由索引2編址,等等。
value: 應設置的值。

——imbenben

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章