Wyodrębnianie danych
Dane źródłowe są wyodrębniane przez sterownik ODBC XML z usług danych lub z plików XML. Dane z usług danych są wyodrębniane za pomocą procesu przemieszczania, w którym małe kompilacje ETL wyodrębniają dane i zapisują je w tabelach tymczasowych, a inne kompilacje ETL pobierają dane z tych tabel, transformują je i odwzorowują na dane w operacyjnej składnicy danych hurtowni danych. W przypadku produktów obsługujących ładowanie różnicowe wyodrębnianie danych odbywa się za pomocą operacji ładowania różnicowego. Struktura danych źródłowych jest specyficzna dla źródła danych. Atrybuty są wyodrębniane w zależności od celów pomiaru. Dlatego nie wszystkie atrybuty dostępne w źródłach danych są ładowane do hurtowni danych.
Transformowanie danych
Dostarczanie danych
Atrybut sterowania udostępniany przez menedżera danych. Ten atrybut jest przeznaczony dla unikalnego numeru każdego wiersza i musi zostać odwzorowany na kolumnę klucza odpowiednika w tabeli hurtowni danych.
Atrybut sterowania udostępniany przez menedżera danych. Ten atrybut jest przeznaczony dla daty aktualizacji istniejącego wiersza i musi zostać odwzorowany na kolumnę REC_TIMESTAMP w tabeli hurtowni danych.
Ta kolumna w hurtowni danych musi zostać użyta do zapisania identyfikatora GUID źródła danych, którego można użyć do rozróżniania danych z różnych źródeł danych. Dla źródeł danych, z których dane są wyodrębniane przez sterownik ODBC XML, identyfikator GUID jest przypisywany automatycznie każdej grupie zasobów, a jego wartość jest umieszczana we wszystkich tabelach w kolumnie DATASOURCE_ID, która musi być odwzorowana na kolumnę SOURCE_ID w tabeli hurtowni danych. W przypadku innych źródeł danych, dla których sterownik ODBC XML nie jest używany, wartość tę należy nadać ręcznie.
Atrybut do przechowywania klucza naturalnego ze źródła danych - typu całkowitego lub znakowego.
Atrybut do przechowywania identyfikatora widocznego dla użytkownika, o ile źródło danych ma taki identyfikator.
Atrybut do przechowywania adresu URL zasobu XML źródła danych.
Atrybut dla powszechnie wykorzystywanych artefaktów, takich jak projekty, żądania, wymagania, zadania, działania i komponenty. Tego atrybutu można użyć do dalszego klasyfikowania danych w tabelach. Dla każdego z tych artefaktów w hurtowni danych definiowana jest tabela o nazwie zawierającej przyrostek _CLASSIFICATION, a identyfikatory i wartości są predefiniowane podczas tworzenia hurtowni danych. Kompilacje ETL dostarczające te artefakty do hurtowni danych muszą określać wartość identyfikatora klasyfikacji i odwzorowywać go na odpowiednią kolumnę z przyrostkiem _CLASS_ID w nazwie.