Funktion zum Aufspüren von Beziehungen konfigurieren

Sie können die Aufspürfunktion verwenden, um Beziehungen zwischen Quellen und Zielen im Zuordnungseditor zu suchen. Die Aufspürfunktion ist für eine grundlegende Suche nach übereinstimmenden Elementen konfiguriert, ohne dass weitere Änderungen an der Konfiguration vorgenommen werden müssen. Sie können jedoch eingrenzen, wie die Funktion Beziehungen sucht, indem Sie die Benutzervorgaben im Zuordnungseditor aktualisieren.

Die Eigenschaften Ihrer Daten und die Eigenschaften der Strukturen im Zuordnungseditor können zum Integrieren von Daten verwendet werden. Sie können die Eigenschaften der Daten und Strukturen oder die Metadaten verwenden, um die Beziehungen zwischen Quellen- und Zieldatenquellen zu verstehen. Beispiel: Mithilfe von Metadatenbeziehungen können Sie ein Script erstellen, das Daten aus einer vorhandenen Datenbank Daten einer neu erworbenen Firma zuordnet. Die Metadateneigenschaften können Beziehungen umfassen, die besonderes bei großen Schemata ohne Hilfe durch die Aufspürfunktion möglicherweise schwierig zu erkennen sind.

Die Aufspürfunktion untersucht die Metadaten, um nach möglichen Übereinstimmungen ohne manuelle Interaktion mit den Metadaten zu suchen. Mit dieser Konfiguration können Sie modifizieren, wie die Aufspürfunktion suchen soll und auf welchen Daten oder Metadaten die Suche basieren soll.

Sie können eine globale Konfiguration für die Aufspürfunktion definieren, indem Sie Fenster > Benutzervorgaben auswählen und die Benutzervorgaben im Assistenten Benutzervorgaben festlegen. Diese Konfigurationen bleiben bestehen, wenn Sie neue Zuordnungseditoren öffnen und schließen, und werden als Standardwerte für neue Zuordnungsmodelle verwendet. Sie können die globalen Konfigurationen für eine spezifische Zuordnungseditorinstanz außer Kraft setzen, indem Sie die erweiterte Konfiguration verwenden. Diese Einstellungen gehen verloren, wenn Sie den Zuordnungseditor schließen.

Grundlegende Aufspürfunktion

Die Aufspürfunktion bietet zwei Methoden zur Steuerung und Feinanpassung der Anzahl der angezeigten Übereinstimmungen: Größte Übereinstimmung suchen und Ähnliches suchen.
Größte Übereinstimmung suchen
Bei Ihren Versuchen, Beziehungen zwischen Objekten zu suchen, sollten Sie diese Methode immer zuerst auswählen. Diese Methode zum Ausführen der Aufspürfunktion bietet die beste Trefferquote bezüglich aller möglichen Objektpaare in allen Elementen im Bereich des Modells. Potenziell besteht für jedes Objekt die Möglichkeit, dass es jederzeit mit jedem anderen Objekt übereinstimmt. Wenn die Aufspürfunktion jedoch alle Elemente des Zuordnungsmodells analysiert, erzeugt die Methode Größte Übereinstimmung suchen die besten Ergebnisse in Bezug auf das gesamte Modell. Die Methode gibt höchstens eine Übereinstimmung für ein Ziel und eine Quelle zurück, die Sie ausgewählt haben. Es ist auch möglich, dass keine Übereinstimmungen gefunden werden.
Ähnliches suchen
Wenn Sie mit den Ergebnissen der Methode Größte Übereinstimmung suchen nicht ganz zufrieden sind, können Sie nach anderen Übereinstimmungen suchen, indem Sie die Methode Ähnliches suchen ausführen. Wenn Sie die Standardkonfiguration verwenden, sucht die Methode nach den ersten 5 Übereinstimmungen für jedes Zielelement, das Sie auswählen. Sie können diese Anzahl ändern. Im Allgemeinen sollten Sie Ähnliches suchen nur auswählen, wenn Sie ein Zielobjekt angeben, auf das Ihre Suche konzentriert werden soll.

Erweiterte Konfiguration: Suchmethoden steuern

Klicken Sie zur Verwendung von erweiterten Aufspürtechniken auf Beziehungen aufspüren > Erweiterte Konfiguration, um die Algorithmen anzugeben, die beim Suchen von Beziehungen zwischen Quellen und Objekten verwendet werden sollen. Für jeden ausgewählten Algorithmus können Sie Parameter zum Eingrenzen der Suche definieren. Die verfügbaren Parameter sind vom ausgewählten Algorithmus abhängig.
Lexikalische Ähnlichkeit
Verwenden Sie diesen Algorithmus, um Beziehungen nach der längsten gemeinsamen Teilsequenz oder nach einer Ähnlichkeit in den Werten der Elemente zu suchen. Bei diesem Algorithmus handelt es sich um einen Algorithmus für Zeichenfolgeabgleich, der nach einer Teilsequenz mit einer maximalen Länge oder maximalen Wertigkeit von zwei oder mehr Zeichenfolgen sucht, die gemeinsam sind. Wenn Sie beispielsweise eine kurze Zeichenfolge (Muster) und eine lange Zeichenfolge (Text) haben und die Buchstaben des Musters in derselben Reihenfolge (aber möglicherweise getrennt) im Text vorhanden sind, ist das Muster eine Teilsequenz des Texts. Das folgende Beispiel zeigt dieses Konzept:
Muster=Wood
Text=The World of words.

Das Muster ist eine Teilsequenz des Texts.
Der Standardalgorithmus ist lexikalische Ähnlichkeit. Beispielsweise besteht eine Werteähnlichkeit zwischen Elementen, wenn diese die gleiche Entitätseigenschaft darstellen, wie zum Beispiel Sample.Employee.Eno und OtherSample.EMP.ID. Elemente mit Fremdschlüsseln und Indizes haben ähnliche Eigenschaften. Eine Abstandsmessgröße wird verwendet, um Gemeinsamkeiten und Unterschieden zwischen Elementen zu ermitteln. Wenn beispielsweise 10 Quellenelemente und 20 Zielelemente abgeglichen werden müssen, kann eine Abstandsmessgröße möglicherweise 200 Messwerte oder 10 Quellenelemente multipliziert mit 20 Zielelementen zurückgeben. Jeder Messwert ist im Allgemeinen eine Kombination aus Quellenelement, Zielelement und einem Abstandswert. Der Schwellenwert für Zurückweisung oder der Maximalwert, um den die Übereinstimmung zurückgewiesen wird, ist ein Abstandswert. Der empfohlene Wert für den Schwellenwert für Zurückweisung ist 1.
Semantischer Name
Verwenden Sie diesen Algorithmus, um Beziehungen nach Thesaurus und Ontologie zu suchen. Sie können unterstützte Thesaurus-Softwareanwendungen und Glossarmodelle verwenden, um den Algorithmus für den semantischen Namen zu verbessern. Der empfohlene Wert für den Schwellenwert für Zurückweisung ist 0,4. Falls Sie einen Thesaurus angeben wollen, wählen Sie ihn in der Liste aus. In der Liste werden unterstützte Anwendungen aufgeführt, wie z. B. WordNet oder SureWord, sofern diese auf Ihrem System installiert sind. Außerdem kann jedes beliebige Glossarmodell mit Synonymangaben im aktuelle Projekt als Thesaurus ausgewählt werden. Falls Sie einen externen Thesaurus verwenden, ist keine weitere Konfiguration auf der Benutzervorgabenseite des Zuordnungseditors erforderlich.
Signatur
Verwenden Sie diesen Algorithmus, um Beziehungen mit einer auf einer Namenssignatur basierten Suchmethode zu suchen. Dieser Algorithmus verwendet die Stichprobenentnahme von Daten, um Beziehungen zu suchen. Ein Wert für die Wertigkeit wird bestimmten Wortklassen innerhalb der Daten zugeordnet. Der empfohlene Wert für die Größe der Stichprobenentnahme ist 100 Zeilen. Gültige Werte für die Größe der Stichprobenentnahme sind 50, 100, 150, 200, 250, 300, 350 und 400. Der empfohlene Wert für die Rate für Stichprobenentnahme ist 20 Prozent. Gültige Werte sind alle ganzen Zahlen zwischen 1 und 100. Der empfohlene Wert für den Schwellenwert für Zurückweisung ist 1. Die bei dieser Aufspürfunktion verwendeten Schemata müssen Schemata von DB2 Universal Database sein. Sie müssen einige Verbindungs- und Berechtigungsinformationen für den Zugriff auf die Daten angeben, damit Sie diesen Algorithmus verwenden können. Wenn die Stichprobenentnahme von Daten verwendet wird, werden die Daten zum Ausführen der Aufspürfunktion in den Cache gestellt. Sie können aus einer Liste verfügbarer Datenbanken, die bereits konfiguriert sind, eine Datenbank für das Caching auswählen oder Sie können eine neue Datenbank für das Caching angeben.
Reguläre Ausdrücke
Verwenden Sie diesen Algorithmus, um Beziehungen mit einer Suchmethode zu suchen, die auf Text- oder Zeichenfolgesuchen basiert, die reguläre Ausdrücke oder Mustererkennung verwenden. Bei einem einfachen regulären Ausdruck handelt es sich um eine exakte Zeichenübereinstimmung.
Verteilungen
Verwenden Sie diesen Algorithmus, um Beziehungen mit einer auf einer Ähnlichkeit innerhalb der Daten basierten Suchmethode zu suchen. Die Aufspürfunktion führt Stichprobenentnahmen von Daten durch, um nach Beziehungen zu suchen. Die bei dieser Aufspürfunktion verwendeten Schemata müssen Schemata von DB2 Universal Database sein. Sie müssen einige Verbindungs- und Berechtigungsinformationen für den Zugriff auf die Daten angeben, damit Sie diesen Algorithmus verwenden können. Der empfohlene Wert für die Größe der Stichprobenentnahme ist 100 Zeilen. Gültige Werte für die Größe der Stichprobenentnahme sind 50, 100, 150, 200, 250, 300, 350 und 400. Der empfohlene Wert für die Rate für Stichprobenentnahme ist 20 Prozent. Gültige Werte sind alle ganzen Zahlen zwischen 1 und 100. Der empfohlene Wert für den Schwellenwert für Zurückweisung ist 1.

Wenn Sie mehrere Algorithmen auswählen, können Sie die Algorithmen nach Sequenz oder nach Wertigkeit kombinieren. Wenn Sie die Algorithmen nach Wertigkeit kombinieren wollen, können Sie anschließend den Prozentsatz der Wichtigkeit für jeden Algorithmus angeben. Sie können die Ergebnisse der Aufspürfunktion eingrenzen, indem Sie die Ergebnisse der gewichteten Algorithmen sortieren und nur den höchsten Prozentsatz beibehalten. Wenn Sie die Algorithmen nach Reihenfolge kombinieren wollen, können Sie die Suchhierarchie für jeden Algorithmus angeben. Durch Auswählen mehrerer Algorithmen wird die Stärke der ausgewählten Algorithmen kombiniert, sodass Beziehungen präziser gesucht werden können.

Sie können einen Schwellenwert für Übereinstimmungswerte festlegen, damit Sie die Art der zu berücksichtigenden Übereinstimmungen steuern können. Sie können die Aufspürfunktion zwischen bestimmten Teilen von Quellen und Zielen bis hin zum kleinsten Element auf jeder Seite ausführen.


Feedback