各製品の資料を入手。
詳細はこちら →RapidMiner からGoogle Cloud Storage のデータに連携
Google Cloud Storage をRapidMiner Studio の標準コンポーネント及びデータソース構成ウィザードと統合します。
最終更新日:2022-10-29
この記事で実現できるGoogle Cloud Storage 連携のシナリオ
こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。
この記事では、CData JDBC Driver for GoogleCloudStorage をRapidMiner のプロセスと簡単に統合する方法を示します。この記事では、CData JDBC Driver for GoogleCloudStorage を使用してGoogle Cloud Storage をRapidMiner のプロセスに転送します。
RapidMiner のGoogle Cloud Storage にJDBC Data Source として接続する
以下のステップに従ってGoogle Cloud Storage へのJDBC 接続を確認できます。
- Google Cloud Storage 用の新しいデータベースドライバーを追加します。[Connections]->[Manage Database Drivers]とクリックします。
- 表示されるウィザードで[Add]ボタンをクリックし、接続に名前を入力します。
- JDBC URL のプレフィックスを入力します。
jdbc:googlecloudstorage:
- インストールディレクトリのlib サブフォルダにあるcdata.jdbc.googlecloudstorage.jar ファイルにパスを入力して下さい。
- ドライバークラスを入力します。
cdata.jdbc.googlecloudstorage.GoogleCloudStorageDriver
- 新しいGoogle Cloud Storage 接続を作成します。[Connections]->[Manage Database Connections]とクリックします。
- 接続の名前を入力します。
- データベースシステムの場合は、以前構成したGoogle Cloud Storage ドライバーを選択します。
- Host ボックスで接続文字列を入力します。
ユーザーアカウントでの認証
ユーザー資格情報の接続プロパティを設定することなく接続できます。InitiateOAuth をGETANDREFRESH に設定したら、接続の準備が完了です。
接続すると、Google Cloud Storage OAuth エンドポイントがデフォルトブラウザで開きます。ログインして権限を付与すると、OAuth プロセスが完了します。
サービスアカウントでの認証
サービスアカウントには、ブラウザでユーザー認証を行わないサイレント認証があります。サービスアカウントを使用して、企業全体のアクセススコープを委任することもできます。
このフローでは、OAuth アプリケーションを作成する必要があります。詳しくは、ヘルプドキュメントを参照してください。以下の接続プロパティを設定したら、接続の準備が完了です:
- InitiateOAuth: GETANDREFRESH に設定。
- OAuthJWTCertType: PFXFILE に設定。
- OAuthJWTCert: 生成した.p12 ファイルへのパスに設定。
- OAuthJWTCertPassword: .p12 ファイルのパスワードに設定。
- OAuthJWTCertSubject: 証明書ストアの最初の証明書が選ばれるように"*" に設定。
- OAuthJWTIssuer: 「サービスアカウント」セクションで「サービスアカウントの管理」をクリックし、このフィールドをサービスアカウントID フィールドに表示されているE メールアドレスに設定。
- OAuthJWTSubject: サブジェクトタイプが"enterprise" に設定されている場合はエンタープライズID に設定し、"user" に設定されている場合はアプリユーザーID に設定。
- ProjectId: 接続するプロジェクトのID に設定。
これで、サービスアカウントのOAuth フローが完了します。
ビルトイン接続文字列デザイナ
JDBC URL の構成については、Google Cloud Storage JDBC Driver に組み込まれている接続文字列デザイナを使用してください。JAR ファイルのダブルクリック、またはコマンドラインからJAR ファイルを実行します。
java -jar cdata.jdbc.googlecloudstorage.jar
接続プロパティを入力し、接続文字列をクリップボードにコピーします。
以下は一般的な接続文字列です。
ProjectId='project1';InitiateOAuth=GETANDREFRESH
- 必要であればユーザー名とパスワードを入力します。
プロセス内の様々なRapidMiner オペレーターとのGoogle Cloud Storage 接続を使用できます。Google Cloud Storage を取得するには、[Operators]ビューから[Retrieve]をドラッグします。
[Retrieve]オペレータを選択した状態で、[repository entry]の横にあるフォルダアイコンをクリックして[Parameters]ビューで取得するテーブルを定義できます。表示されるRepository ブラウザで接続ノードを展開し、目的のサンプルセットを選択できます。

最後に、[Retrieve]プロセスから結果に出力をワイヤリングし、プロセスを実行してGoogle Cloud Storage を確認します。
