各製品の資料を入手。
詳細はこちら →ThoughtSpot からAmazon S3 に接続して、データを可視化する方法
CData Connect Cloud を使ってAmazon S3 リアルタイムデータに接続し、ThoughtSpot でカスタムレポートを作成します。
最終更新日:2024-04-22
この記事で実現できるAmazon S3 連携のシナリオ
こんにちは!パートナーサクセス担当の赤塚です。
ThoughtSpot は、日本語にも対応しているGoogle のような直感的な検索機能と、AI による支援でSQL 無しでデータ分析ができるBI プラットフォームです。

ThoughtSpot ではSaaS などのデータが保存されたデータウェアハウスやデータベースに対して接続を行う構成が一般的ですが、CData Connect Cloud の連携により、データウェアハウスを介さずにSaaS との直接連携が可能になるため、ETLなどのパイプラインやデータ基盤を持たない企業でも素早くデータ活用が始められます。
CData Connect Cloud とは?
CData Connect Cloud は、以下のような特徴を持ったクラウド型のリアルタイムデータ連携製品です。
- SaaS やクラウドデータベースを中心とする150種類以上のデータソース
- BI、アナリティクス、ETL、ローコードツールなど30種類以上のツールやアプリケーションから利用可能
- リアルタイムのデータ接続に対応。データの複製を作る必要はありません
- ノーコードでシンプルな設定
詳しくは、こちらの製品資料をご確認ください。
Connect Cloud アカウントの取得
以下のステップを実行するには、CData Connect Cloud のアカウントが必要になります。こちらから製品の詳しい情報とアカウント作成、30日間無償トライアルのご利用を開始できますので、ぜひご利用ください。
Connect Cloud からAmazon S3 への接続
CData Connect Cloud では、直感的なクリック操作ベースのインターフェースを使ってデータソースに接続できます。
- Connect Cloud にログインし、 Add Connection をクリックします。
- 「Add Connection」パネルから「Amazon S3」を選択します。
-
必要な認証プロパティを入力し、Amazon S3 に接続します。
Amazon S3 リクエストを認可するには、管理者アカウントまたはカスタム権限を持つIAM ユーザーの認証情報を入力します。AccessKey をアクセスキーID に設定します。SecretKey をシークレットアクセスキーに設定します。
Note: AWS アカウント管理者として接続できますが、AWS サービスにアクセスするにはIAM ユーザー認証情報を使用することをお勧めします。
尚、CData 製品はAmazon S3 のファイルの一覧表示やユーザー管理情報の取得用です。S3 に保管されているExcel、CSV、JSON などのファイル内のデータを読み込みたい場合には、Excel Driver、CSV Driver、JSON Driver をご利用ください。
アクセスキーの取得
IAM ユーザーの資格情報を取得するには:
- IAM コンソールにサインインします。
- ナビゲーションペインで「ユーザー」を選択します。
- ユーザーのアクセスキーを作成または管理するには、ユーザーを選択してから「セキュリティ認証情報」タブを選択します。
AWS ルートアカウントの資格情報を取得するには:
- ルートアカウントの資格情報を使用してAWS 管理コンソールにサインインします。
- アカウント名または番号を選択し、表示されたメニューで「My Security Credentials」を選択します。
- 「Continue to Security Credentials」をクリックし、「Access Keys」セクションを展開して、ルートアカウントのアクセスキーを管理または作成します。
AWS ロールとして認証
多くの場合、認証にはAWS ルートユーザーのダイレクトなセキュリティ認証情報ではなく、IAM ロールを使用することをお勧めします。RoleARN を指定することでAWS ロールを代わりに使用できます。これにより、CData 製品は指定されたロールの資格情報を取得しようと試みます。
(すでにEC2 インスタンスなどで接続されているのではなく)AWS に接続している場合は、ロールを引き受けるIAM ユーザーのAccessKey とSecretKey を追加で指定する必要があります。AWS ルートユーザーのAccessKey および SecretKey を指定する場合、ロールは使用できません。
SSO 認証
SSO 認証を必要とするユーザーおよびロールには、RoleARN およびPrincipalArn 接続プロパティを指定してください。各Identity Provider に固有のSSOProperties を指定し、AccessKey とSecretKey を空のままにする必要があります。これにより、CData 製品は一時的な認証資格情報を取得するために、リクエストでSSO 認証情報を送信します。
- Create & Tast をクリックします。
- 「Add Amazon S3 Connection」ページの「Permissions」タブに移動し、ユーザーベースのアクセス許可を更新します。
コネクションの設定が完了したら、ThoughtSpot からAmazon S3 のデータへの接続準備は完了です。
Amazon S3 のデータにリアルタイムでThoughtSpot からアクセス
それでは、前のステップで追加した接続設定を使ってThoughtSpot からAmazon S3 への接続を作っていきます。設定内容の詳細については以下のリンクでも紹介していますので、つまづいた場合はぜひご利用ください。
Connect Cloud からThoughtSpot への接続方法以下の項目を設定します。
- ホスト:tds.cdata.com
- ポート:14333
- ユーザー:CData Connect のユーザー名を入力します。ユーザー名は、Connect Cloud の画面の右上に表示されています。例:test@cdata.co.jp
- パスワード:Settings のAccess Tokens ページで生成したPAT を入力します。
- データベース:先ほど作成対したConnect Cloud データソースのコネクション名を入力します。例:Amazon S31

接続設定が完了したら、分析したいテーブルを選択しましょう。テーブルを選択後、「接続を作成」をクリックします。

これで、ThoughtSpot からAmazon S3 への接続を作成できました。完了すると、「接続」ページに作成した接続が表示されます。

接続が追加できたら、右上の「Search Data」から自然言語で質問するだけで、AI がいい感じに可視化を作成してくれます。

任意:メタデータの取得に時間がかかるときの対処法
ThoughtSpot に登録した接続情報が多く、ThoughtSpot から CData Connect Cloud への接続時にメタデータの取得で時間がかかるときがあります。その場合、以下のようにCData Connect Cloud のVirtual Databases 機能を使って作成したテーブルをThoughtSpot からの接続時に指定することでパフォーマンスを改善できます。

Virtual Databases への接続情報は以下のスクリーンショット内のView Endpoints から確認できます。

ThoughtSpot からAmazon S3 のデータにリアルタイム連携
これで、可視化の作成は完了です。あとは、Amazon S3 から自在にデータを取得して、ThoughtSpot での可視化・分析・ダッシュボード構築に活用できます。
クラウドアプリケーションから150を超えるSaaS、ビッグデータ、NoSQL データソースへのリアルタイムデータ連携の実現には、CData Connect Cloud の30日間無償トライアルをぜひお試しください。