各製品の資料を入手。
詳細はこちら →複数Redshift アカウントをレプリケーション
複数のRedshift アカウントを、1つあるいは多数のデータベースにレプリケーション。
最終更新日:2022-06-05
こんにちは!プロダクトスペシャリストの宮本です。
CData Sync for Redshift は、データベースにサンドボックスや製品インスタンスをレプリケートするなどの、レプリケーションの多様なシナリオに対する解決策を提供するスタンドアロンアプリケーションです。Sync for Windows およびSync for Java はどちらもコマンドラインインターフェース(CLI)を含んでおり、複数のRedshift 接続を簡単に管理できます。この記事では、CLI を使って複数のRedshift アカウントをレプリケートする方法について説明します。
Redshift 接続の構成
接続およびE メール通知設定をXML 設定ファイルに保存できます。複数のRedshift アカウントをレプリケートするには、複数の設定ファイルを使います。以下にRedshift をSQLite にレプリケートする設定例を示します。
Windows
<?xml version="1.0" encoding="UTF-8" ?>
<CDataSync>
<DatabaseType>SQLite</DatabaseType>
<DatabaseProvider>System.Data.SQLite</DatabaseProvider>
<ConnectionString>User=admin;Password=admin;Database=dev;Server=examplecluster.my.us-west-2.redshift.amazonaws.com;Port=5439;</ConnectionString>
<ReplicateAll>False</ReplicateAll>
<NotificationUserName></NotificationUserName>
<DatabaseConnectionString>Data Source=C:\my.db</DatabaseConnectionString>
<TaskSchedulerStartTime>09:51</TaskSchedulerStartTime>
<TaskSchedulerInterval>Never</TaskSchedulerInterval>
</CDataSync>
Java
<?xml version="1.0" encoding="UTF-8" ?>
<CDataSync>
<DatabaseType>SQLite</DatabaseType>
<DatabaseProvider>org.sqlite.JDBC</DatabaseProvider>
<ConnectionString>User=admin;Password=admin;Database=dev;Server=examplecluster.my.us-west-2.redshift.amazonaws.com;Port=5439;</ConnectionString>
<ReplicateAll>False</ReplicateAll>
<NotificationUserName></NotificationUserName>
<DatabaseConnectionString>Data Source=C:\my.db</DatabaseConnectionString>
</CDataSync>
Redshift への接続には次を設定します:
- Server: 接続するデータベースをホストしているクラスタのホスト名およびIP アドレス。
- Port: クラスタのポート。
- Database: データベース名、ブランクの場合ユーザーのデフォルトデータベースになります。
- User: ユーザー名。
- Password: ユーザーのパスワード。
Server およびPort の値はAWS の管理コンソールで取得可能です:
- Amazon Redshift console (http://console.aws.amazon.com/redshift) を開く。
- Clusters ページで、クラスタ名をクリック。
- クラスタのConfiguration タブで、表示された接続文字列からクラスタのURL をコピーします。
各Redshift インスタンスにクエリを設定
Sync を使うと標準SQL でレプリケーションを制御できます。REPLICATE ステートメントはハイレベルなコマンドで、データベースにテーブルをキャッシュして維持します。Redshift API がサポートするあらゆるSELECT クエリを定義できます。下記のステートメントは、Redshift のデータ のテーブルをキャッシュしてインクリメンタルに更新します。
REPLICATE Orders;
特定のデータベースを更新するために使用するレプリケーションクエリを含むファイルを指定することができます。レプリケーションステートメントはセミコロンで区切ります。次のオプションは、複数のRedshift アカウントを同じデータベースにレプリケートする場合に便利です。
REPLICATE SELECT ステートメントでは、異なるテーブルのプレフィックスを使用できます。
REPLICATE PROD_Orders SELECT * FROM Orders
異なるスキーマを使用することもできます。
REPLICATE PROD.Orders SELECT * FROM Orders
Sync の実行
接続文字列およびレプリケーションクエリの設定が完了したら、次のコマンドラインオプションを使ってSync を実行できます。
Windows
RedshiftSync.exe -g MyProductionRedshiftConfig.xml -f MyProductionRedshiftSync.sql
Java
java -Xbootclasspath/p:c:\sqlitejdbc.jar -jar RedshiftSync.jar -g MyProductionRedshiftConfig.xml -f MyProductionRedshiftSync.sql