各製品の資料を入手。
詳細はこちら →Google Data Catalog のデータを複数のデータベースにレプリケーション。
Google Data Catalog をPoint-and-click 操作で複数の異なるデータベースに同期する方法。
最終更新日:2022-11-28
こんにちは!プロダクトスペシャリストの宮本です。
常時起動のアプリケーションは、自動フェイルオーバー機能およびリアルタイムなデータアクセスを必要とします。CData Sync は、リアルタイムGoogle Data Catalog のデータをミラーリングデータベース、上記稼働のクラウドデータベース、レポーティングサーバーなどのほかのデータベースに連携し、Windows からリモートGoogle Data Catalog に接続し、自動的に同期を取ります。
レプリケーションの同期先の設定
CData Sync を使って、Google Data Catalog をクラウド・オンプレにかかわらず複数のデータベースレプリケーションします。レプリケーションの同期先を追加するには、[接続]タブを開きます。
それぞれのデータベース向けに以下を行います:
- [同期先]タブをクリックします。
- 同期先を選択します。この記事では、SQLite を使います。
- 必要な接続プロパティを入力します。SQLite データベースにGoogle Data Catalog をレプリケートするためにDataSource ボックスにファイルパスを入力します。
- [接続のテスト]をクリックして、正しく接続できているかをテストします。
- [変更を保存]をクリックします。

Google Data Catalog 接続の設定
データソース側にGoogle Data Catalog を設定します。[接続]タブをクリックします。
- [同期先]タブをクリックします。
- Google Data Catalog アイコンをデータソースとして選択します。プリインストールされたソースにGoogle Data Catalog がない場合には、追加データソースとしてダウンロードします。
- 接続プロパティに入力をします。
Google Data Catalog 接続プロパティの取得・設定方法
認証プロパティを追加する前に、次の接続プロパティを設定してください。
- OrganizationId:接続するGoogle Cloud Platform の組織リソースに関連付けられたID。これはGCP コンソールに移動して確認してください。 「プロジェクト」ドロップダウンメニューを開き、リストから組織へのリンクをクリックします。このページから組織ID を取得できます。
- ProjectId:接続するGCP のプロジェクトリソースに関連付けられたID。GCP コンソールのダッシュボードに移動し、「プロジェクトを選択」のメニューからお好みのプロジェクトを選択して確認してください。プロジェクトID は、「プロジェクト情報」項目に表示されます。
Google Data Catalog への認証
CData 製品は、認証にユーザーアカウント、サービスアカウント、およびGCP インスタンスアカウントの使用をサポートします。
OAuth の設定方法については、ヘルプドキュメントの「OAuth」セクションを参照してください。
- [接続のテスト]をクリックして、正しく接続できているかをテストします。
- [変更を保存]をクリックします。
レプリケーションを実行するクエリの設定
CData Sync はレプリケーションをコントロールするSQL クエリを簡単なGUI 操作で設定できます。レプリケーションジョブ設定には、[ジョブ]タブに進み、[ジョブを追加]ボタンをクリックします。 次にデータソースおよび同期先をそれぞれドロップダウンから選択します。

テーブル全体をレプリケーションする
テーブル全体をレプリケーションするには、[テーブル]セクションで[テーブルを追加]をクリックします。表示されたテーブルリストからレプリケーションするテーブルをチェックします。

テーブルをカスタマイズしてレプリケーションする
SQL クエリを使って、レプリケーションをカスタマイズすることができます。REPLICATE ステートメントは、データベースにテーブルをキャッシュして、保持するハイレベルなコマンドです。Google Data Catalog API でサポートされているSELECT クエリを使うことができます。レプリケーションのカスタマイズには、[カスタムクエリを追加]をクリックして、カスタムクエリステートメントを定義します。
次のステートメントは、Google Data Catalog のテーブルのアップデートを差分更新でキャッシュします:
REPLICATE Schemas;
特定のデータベースを更新するために、レプリケーションクエリを含むファイルを指定することもできます。レプリケーションクエリをセミコロンで区切ります。複数のGoogle Data Catalog アカウントを同じデータベースに同期しようとする際には、以下のオプションが便利です:
-
REPLICATE SELECT ステートメントで別のprefix を使う:
REPLICATE PROD_Schemas SELECT * FROM Schemas;
-
別の方法では、別のスキーマを使う:
REPLICATE PROD.Schemas SELECT * FROM Schemas;
レプリケーションのスケジュール起動設定
[スケジュール]セクションでは、レプリケーションジョブの自動起動スケジュール設定が可能です。反復同期間隔は、15分おきから毎月1回までの間で設定が可能です。

レプリケーションジョブを設定したら、[変更を保存]ボタンを押して保存します。Google Data Catalog のオンプレミス、クラウドなどのデータベースへのレプリケーションジョブは一つではなく複数を作成することが可能です。