HTTP または FTP を使用して既存の Web リソースをインポートする

HTTP または FTP を呼び出すウィザードを使用して、既存の Web リソースを製品にインポートできます。 これらのインポート・ウィザードは、以下のことを可能にすることによって、Web サイト全体を Web プロジェクトに自動転送します。

これらのインポート・ウィザードは、ファイアウォールが装備された Web サーバーのインポート機能もサポートします。 HTTP および FTP インポートはいずれもプロキシーをサポートし、FTP インポートは SOCKS をサポートします。 Rational Developer は、FTP の使用時に受動モード構成セットアップを採用して、セキュリティー・リスクを最小限に抑え、日常の操作でより安全な転送を可能にします。

HTTP または FTP インポート・ウィザードを使用するには、ファイルをインポートする既存のプロジェクトを指定する必要があります。 すべてのファイルを、選択したプロジェクト・フォルダー内にインポートした Web サイトから表示することができます。

HTTP インポートは、HTTP プロトコルを使用して、指定した最初の URL を基にして Web サイトを順にクロールしていきます。 インポート・アクションは、URL を使用して、使用可能な HTML コンテンツを検索し、HTTP リンクの構文解析も行います。このプロセスは、Web サイト内で発生した他の Web ページを参照するコンテンツおよびリンクを構文解析するまで繰り返されます。HTTP インポートは、フォームが JavaServer Pages (JSP) に post されたとき、または組み込まれたときに実行されるサーブレットまたはプログラムを含むページを構文解析できません。

プロジェクトに転送されたファイルは、Web サイトの URL の論理的スナップショットを表します。 これは、サービス提供サイトの HTML 応答によって獲得されたファイル付きで Web プロジェクトが取り込まれることを意味します。また、 サービス提供サイト上の物理リソースをプロジェクトにコピーする必要がないことも意味します。 例えば、JSP ページを求める HTTP 要求には、JSP ページそのものではなく、レンダリングされた HTML 応答が戻されます。 静的ページおよび FTP アクセスを行わないサイトには HTTP インポートを使用することをお勧めします。

HTTP を使用して既存の Web リソースを Web プロジェクトにインポートするには、以下のステップを実行します。

  1. 「新規 Web プロジェクト」ウィザードを使用して、Web リソースをインポートする新規プロジェクトを作成する。
  2. 既存のプロジェクトを使用する予定であれば、「プロジェクト・ エクスプローラー」ビューでプロジェクトを選択する。
  3. 「ファイル」 > 「インポート」を選択する。
  4. 「インポート」ダイアログで「HTTP」を選択し、 「次へ」をクリックする。
  5. 「インポートする宛先フォルダーおよびリソースの指定 (Specify the destination folder and the resources to import)」ページに、必要なプロジェクト情報を入力する。
    • フォルダー - インポートされたファイルはデフォルト・ロケーション (Web content フォルダー) に置かれます。 「参照」ボタンをクリックして、プロジェクトにインポートされるファイルのロケーションを変更できます。
    • URL - 「URL」フィールドに HTTP URL を入力する。URL には、 URL/initial Web ページのドメイン・ネームおよび開始ディレクトリーを組み込む必要があります。
      • 開始ページのないディレクトリー URL (例えば、www.domain.net/Sports/) を入力したときに、Web サーバーから HTML コンテンツが戻された場合、 デフォルトのファイル名が使用されます (デフォルトを指定しなかった場合、index.html が使用されます)。 .
      • HTTP クロールによって、 元のサーバー上に存在しないファイルが作成されることがあります。 例えば、ディレクトリー名の HTTP 参照を行うと、 そのディレクトリーについて記述した HTML コンテンツが Web サーバーから返送されることになります。 HTTP クローラーは、その応答を index.html として保管します。
      • ドメイン名 (例えば、www.domain.net) のみを入力した場合、 「インポート」ウィザードは文書ルート・ディレクトリー内でデフォルト・ページを 検索します。
      「拡張」ボタンをクリックすると、 「拡張設定」ダイアログ・ボックスでプロキシー接続を指定するオプションを利用することができます。「プロキシー・サーバーの使用」チェック・ボックスを選択すると、SOCKS または HTTP のどちらか のプロキシーを選択するオプションと、対応するサーバーおよびポートの値を指定する オプションが使用可能になります。
    • HTTP リンクをたどるときの深さの制限 - 提供される適切なラジオ・ボタンを選択することで、リンクをたどるインポートのスコープを限定できます。
      • 制限なし - このオプションは、HTTP インポートがドメイン内のすべてのページを構文解析できるようにします。
      • 制限 - このオプションは、クロールするリンク・レベルの深さの制限を決定します。例えば、1 を選択すると、インポートするページから 1 リンク (レベル 1) 内のすべての Web ページがナビゲートされます。制限を 2 にすると、 レベル 1 のすべてのリンクおよびレベル 1 Web ページに直接リンクされているものがインポートされます。

        例えば、クロールの深さを 2 に指定した場合に、最初の URL が http://host/initialLevel/index.html であったとします。 index.html に http://host/initialLevel/L2/L3/index2.html への参照がある場合、レベル 3 にある index2.html はフィルタリングされて除外され、そのコンテンツのクロールの後に続く構文解析は行われません。

  6. 「次へ」をクリックしてさらにオプションを指定するか、または 「終了」をクリックして Web サイトをインポートする。
  7. 適切なインポート・オプションの指定」ページで 「次へ」を選択した場合、提供される選択項目の中から選択する。
    • リンクを文書相対に変換する - このオプションを選択すると、HTML ファイル内のリンクは、 ファイル・システム内の新しいロケーションに基づいた絶対リンクを作成するのではなく、文書からの相対方式で更新されます。
    • 警告を出さずに既存リソースを上書きする - このオプションを選択すると、プロジェクト内の既存のワークベンチ・ファイルが上書きされます。 このオプションを選択しないと、インポートされたファイルは上書きされません。 ファイルを選んで上書きするかどうかを尋ねるプロンプトは表示されません。
    • 開始 URL の親フォルダー内のファイルまでリンクをたどらない (Do not follow links to files in parent folders of the starting URL) - このオプションを選択すると、FTP インポートに最初に示された URL より上位のリソースをクロールさせないようにします。 例えば、最初の URL が http://host/l1/l2/index.html で、 ページ参照内のリンクが http://host/index.html の場合、このオプションはリンク先のリソースをインポートの対象に含めるかどうかを決定します。 このオプションにチェックを付けないと、非常に多数のサイトがクロールされ、不必要なファイルが大量にインポートされる恐れがあります。
    • 接続タイムアウト - このオプションは、HTTP 接続タイムアウト値を決定します。ミリ秒単位で測定されます。 接続タイムアウトは、試行をやめるまでにサーバーからのメッセージを待つ時間を指定する手段です。
  8. 「終了」をクリックし、オプション付きで Web サイトをインポートする。
  9. 新たに情報を取り込んだプロジェクトまたはフォルダー内のディレクトリー構造とファイル・データの整合性を検証します。

フィードバック