各製品の資料を入手。
詳細はこちら →SAS でCData ODBC Driver for Amazon S3 を使用
CData ODBC Driver を使用してSAS からリアルタイムAmazon S3 に接続します。
最終更新日:2022-03-10
この記事で実現できるAmazon S3 連携のシナリオ
こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。
SAS は、高度なアナリティクス、多変量解析、BI、データ管理、予測分析のためのソフトウェアです。SAS とCData ODBC Driver for AmazonS3 を合わせて使うことで、SAS からリアルタイムAmazon S3 のデータへデータベースライクにアクセスできるようになり、レポーティング、分析能力を向上できます。本記事では、SAS でAmazon S3 のライブラリを作成し、リアルタイムAmazon S3 に基づいたシンプルなレポートを作成します。
CData ODBC ドライバーは、ドライバーに組み込まれた最適化されたデータ処理により、SAS でリアルタイムAmazon S3 のデータを送受信する場合に圧倒的なパフォーマンスを提供します。SAS からAmazon S3 に複雑なSQL クエリを発行すると、ドライバーはフィルタや集計などのサポートされているSQL 操作をAmazon S3 に直接プッシュし、組み込みSQL エンジンを利用して、サポートされていない操作(一般的にはSQL 関数とJOIN 操作)をクライアント側で処理します。組み込みの動的メタデータクエリを使用すると、SAS でAmazon S3 を簡単にビジュアライズおよび分析できます。
CData ODBC ドライバとは?
CData ODBC ドライバは、以下のような特徴を持ったリアルタイムデータ連携ソリューションです。
- Amazon S3 をはじめとする、CRM、MA、会計ツールなど多様なカテゴリの270種類以上のSaaS / オンプレミスデータソースに対応
- 多様なアプリケーション、ツールにAmazon S3 のデータを連携
- ノーコードでの手軽な接続設定
- 標準 SQL での柔軟なデータ読み込み・書き込み
CData ODBC ドライバでは、1.データソースとしてAmazon S3 の接続を設定、2.SAS 側でODBC Driver との接続を設定、という2つのステップだけでデータソースに接続できます。以下に具体的な設定手順を説明します。
CData ODBC ドライバのインストールとAmazon S3 への接続設定
まずは、本記事右側のサイドバーからAmazonS3 ODBC Driver の無償トライアルをダウンロード・インストールしてください。30日間無償で、製品版の全機能が使用できます。
以下は、Amazon S3 に接続するための情報と、Windows およびLinux 環境でDSN を構成するためのステップです。
Amazon S3 リクエストを認可するには、管理者アカウントまたはカスタム権限を持つIAM ユーザーの認証情報を入力します。AccessKey をアクセスキーID に設定します。SecretKey をシークレットアクセスキーに設定します。
Note: AWS アカウント管理者として接続できますが、AWS サービスにアクセスするにはIAM ユーザー認証情報を使用することをお勧めします。
尚、CData 製品はAmazon S3 のファイルの一覧表示やユーザー管理情報の取得用です。S3 に保管されているExcel、CSV、JSON などのファイル内のデータを読み込みたい場合には、Excel Driver、CSV Driver、JSON Driver をご利用ください。
アクセスキーの取得
IAM ユーザーの資格情報を取得するには:
- IAM コンソールにサインインします。
- ナビゲーションペインで「ユーザー」を選択します。
- ユーザーのアクセスキーを作成または管理するには、ユーザーを選択してから「セキュリティ認証情報」タブを選択します。
AWS ルートアカウントの資格情報を取得するには:
- ルートアカウントの資格情報を使用してAWS 管理コンソールにサインインします。
- アカウント名または番号を選択し、表示されたメニューで「My Security Credentials」を選択します。
- 「Continue to Security Credentials」をクリックし、「Access Keys」セクションを展開して、ルートアカウントのアクセスキーを管理または作成します。
AWS ロールとして認証
多くの場合、認証にはAWS ルートユーザーのダイレクトなセキュリティ認証情報ではなく、IAM ロールを使用することをお勧めします。RoleARN を指定することでAWS ロールを代わりに使用できます。これにより、CData 製品は指定されたロールの資格情報を取得しようと試みます。
(すでにEC2 インスタンスなどで接続されているのではなく)AWS に接続している場合は、ロールを引き受けるIAM ユーザーのAccessKey とSecretKey を追加で指定する必要があります。AWS ルートユーザーのAccessKey および SecretKey を指定する場合、ロールは使用できません。
SSO 認証
SSO 認証を必要とするユーザーおよびロールには、RoleARN およびPrincipalArn 接続プロパティを指定してください。各Identity Provider に固有のSSOProperties を指定し、AccessKey とSecretKey を空のままにする必要があります。これにより、CData 製品は一時的な認証資格情報を取得するために、リクエストでSSO 認証情報を送信します。
DSN を構成する際に、Max Rows プロパティを定めることも可能です。これによって返される行数を制限するため、ビジュアライゼーション・レポートのデザイン時のパフォーマンスを向上させるのに役立ちます。
Windows
未指定の場合は、初めにODBC DSN(data source name)で接続プロパティを指定します。ドライバーのインストールの最後にアドミニストレーターが開きます。Microsoft ODBC Data Source Administrator を使用して、ODBC DSN を作成および構成できます。
Linux
Linux 環境にCData ODBC Driver for AmazonS3 をインストールする場合、ドライバーのインストールによりシステムDSN が事前定義されます。システムデータソースファイル(/etc/odbc.ini) を編集し、必要な接続プロパティを定義することで、DSN を変更できます。
/etc/odbc.ini
[CData AmazonS3 Sys]
Driver = CData ODBC Driver for AmazonS3
Description = My Description
AccessKey = a123
SecretKey = s123
これらの構成ファイルの使用に関する具体的な情報については、ヘルプドキュメントを参照してください。
SAS でAmazon S3 ライブラリを作成
CData ODBC Driver for AmazonS3 に基づくライブラリを追加することで、SAS でAmazon S3 に接続します。
- SAS を開き、[Explorer]ペインで[Libraries]を展開します。
- [Active Libraries]ウィンドウで右クリックし、[New]を選択します。
- ライブラリに名前を付け(odbclib)、Engine としてODBC を選択し、ライブラリをセッション間で保持する場合は[Enable at startup]をクリックします。
- Data Source を以前構成したDSN に設定し、[OK]をクリックします。
Amazon S3 クエリからビューを作成
SAS は、ローコードのポイントアンドクリッククエリツールを使用するか、PROC SQL とカスタムSQL クエリのプログラムを使うことで、データのクエリをネイティブにサポートします。SAS でビューを作成すると、ビューがクエリされるたびに定義クエリが実行されます。これは、レポート、チャート、分析について常にリアルタイムAmazon S3 のデータにクエリを実行することを意味します。
クエリツールの使用
- SAS で[Tools]->[Query]と進みます。
- データをプルするテーブルソースとテーブルを選択し、[OK]をクリックします。
- カラムを選択し、右クリックしてフィルタリング、順序付け、グループ化などを追加します。
- [SQL Query Tool]ウィンドウを右クリックして[Show Query]を選択し、[Create View]をクリックして、クエリの結果を含むローカルビューを作成します。ビューに名前を付け、[OK] をクリックします。
PROC SQL の使用
- SAS で、[Editor]ウィンドウに移動します。
- PROC SQL を使用してデータをクエリし、ローカルビューを作成します。
Note:このステップにより、[Work]ライブラリにビューが作成されます。オプションとして、create view ステートメントでライブラリを指定できます。proc sql; create view objectsacl_view as select name, ownerid from odbclib.objectsacl where Name = 'TestBucket'; quit;
- [Run]->[Submit]とクリックしてクエリを実行し、ローカルビューを作成します。
SAS のAmazon S3 のデータに関するレポートまたはビジュアライズ
ローカルビューを作成すると、パワフルなSAS 機能を使用してAmazon S3 のデータをレポート、ビジュアライズ、またはその他の方法で分析できます。PROC PRINT を使用して簡単なレポートを印刷し、PROC GCHART を使用してデータに基づいた基本的なグラフを作成しましょう。
HTML を印刷
- SAS で、[Editor]ウィンドウに移動します。
- PROC PRINT を使用してAmazon S3 ObjectsACL データのHTML レポートを印刷します。
proc print data=objectsacl; title "Amazon S3 ObjectsACL Data"; run;
チャートを印刷
- SAS で、[Editor]ウィンドウに移動します。
- PROC GCHART を使用してObjectsACL データのチャートを作成します。
proc gchart data=objectsacl; pie name / sumvar=ownerid value=arrow percent=arrow noheading percent=inside plabel=(height=12pt) slice=inside value=none name='ObjectsACLChart'; run;
Amazon S3 からSAS へのデータ連携には、ぜひCData ODBC ドライバをご利用ください
このようにCData ODBC ドライバと併用することで、270を超えるSaaS、NoSQL データをコーディングなしで扱うことができます。30日の無償評価版が利用できますので、ぜひ自社で使っているクラウドサービスやNoSQL と合わせて活用してみてください。
CData ODBC ドライバは日本のユーザー向けに、UI の日本語化、ドキュメントの日本語化、日本語でのテクニカルサポートを提供しています。