DB2 Text Extender
DB2 Text Extender 是一種文字擷取程式,它提供 SQL(結構化查詢語言)的延伸。
它使用智慧型的搜尋引擎,搜尋儲存在 DB2 資料庫內的非結構化文字。
將 DB2 Text Extender 整合至 WebSphere Commerce 商店中,可提供客戶搜尋產品的效率。
DB2 Text Extender 會兼顧到同義字與字詞關係,因此,搜尋者的彈性也比較大。
DB2 Text Extender 的擷取系統會產生含有從資料庫直欄中擷取出來的重要字詞及直欄文字參照的內部索引。
當客戶在商店或商店群組內起始搜尋時,擷取系統會尋找客戶輸入資料和索引字詞之間的相符之處。
當它發現相符之處,對應的直欄資料會從資料庫中的適當表格被取並且顯示出來。
由於擷取系統是經由索引搜尋,因此速度較快。
作為資料庫準備程序的一部份,您需要對資料庫(其中包含在索引中所要包括的文字)進行表格與直欄的索引。
DB2 Text Extender 可以搜尋下列項目:
- 特定字詞或詞組,例如 "鐵鎚" 或 "男裝"。
- 字詞或詞組的同義字。例如,若客戶搜尋 "書" 一詞,這時也會找出稱為 "文章"、"書籍" 或 "手冊" 的產品。
- 近似詞。例如,客戶可以在 "長褲" 的相同句子或段落中,找到 "牛仔褲"。
- 字詞的變化,像是其複數型或不同的時態。例如,客戶搜尋 "drive" 一詞,也會找到 "driving"、"drove" 以及 "driven"。
在搜尋時可使用萬用字元,並使用前頭、中段、尾段遮罩,以及字詞與字元遮罩。
例如,客戶可以搜尋以 "book" 這幾個字元為開頭的字詞,或以 "card" 一詞為結尾的詞組。
DB2 Text Extender 可以存取任何一種文字,包括不同的語言及格式,而且可以高速搜尋上千份文件。
DB2 Text Extender 功能強大的語言搜尋技術還包括文字分析特性在內,例如:
- 識別包含非英數字元的詞彙,例如 "don't" 或 "$14,225"。
- 將一些大小寫混用的詞彙,與內含強調或特殊字元的詞彙常態化成標準格式。
這可讓購物者搜尋 "computer" 時可找到 "Computer",
或者尋找 "multi-media" 時可找到 "multimedia"。
- 將詞彙還原回其基本型。例如 "media" 的詞彙
將還原為基本型 "medium"。 動詞變化 (例如
"bought") 會還原為它們的原形 ("buy")。
這樣一來,客戶便可以用該產品在資料庫中的名稱搜尋,也可以用一些變化式搜尋。
附註:
- DB2 Text Extender 只能在 DB2 資料庫中執行搜尋。
DB2 Text Extender for iSeries
無法使用 WebSphere Commerce 資料庫綱目。WebSphere Commerce 採用 Unicode 字碼頁 (UCS-2)
來支援產品的多種語言與多文化特性,
而 DB2 Text Extender for iSeries 則無法使用內含 Unicode 資料的欄位。
Linux 中不支援 DB2 Text Extender。