Python でNetSuite のデータを変換・出力するETL 処理を作る方法

CData Python Connector とpetl モジュールを使って、NetSuite のデータを変換後にCSV ファイルに吐き出すETL 処理を実装します。

加藤龍彦
デジタルマーケティング

最終更新日:2023-09-23

この記事で実現できるNetSuite 連携のシナリオ

こんにちは!ウェブ担当の加藤です。マーケ関連のデータ分析や整備もやっています。

Pythonエコシステムには多くのモジュールがあり、システム構築を素早く効率的に行うことができます。本記事では、CData Python Connector for NetSuite とpetl フレームワークを使って、NetSuite のデータにPython から接続してデータを変換、CSV に出力するETL 変換を実装してみます。

CData Python Connector は効率的なデータ処理によりNetSuite のデータ にPython から接続し、高いパフォーマンスを発揮します。NetSuite にデータをクエリする際、ドライバーはフィルタリング、集計などがサポートされている場合SQL 処理を直接NetSuite 側に行わせ、サポートされていないSQL 処理については、組み込みのSQL エンジンによりクライアント側で処理を行います(JOIN やSQL 関数など)。

必要なモジュールのインストール

pip で必要なモジュールおよびフレームワークをインストールします:

pip install petl
pip install pandas

Python でNetSuite のデータをETL 処理するアプリを構築

モジュールとフレームワークをインストールしたら、ETL アプリケーションを組んでいきます。コードのスニペットは以下の通りです。フルコードは記事の末尾に付いています。

CData Connector を含むモジュールをインポートします。

import petl as etl
import pandas as pd
import cdata.netsuite as mod

接続文字列で接続を確立します。connect 関数を使って、CData NetSuite Connector からNetSuite への接続を行います

cnxn = mod.connect("Account Id=XABC123456;Password=password;User=user;Role Id=3;Version=2013_1;")

Netsuite への接続

NetSuite は現在、2つの異なるAPI を提供しています。

  • SuiteTalk はNetSuite との通信に使用する、SOAP ベースのより古いサービスです。多くのエンティティを幅広くサポートし、INSERT / UPDATE / DELETE を完全にサポートします。 しかしデータの抽出用ツールは低機能で、SELECT 時のパフォーマンスは極めて低いです。テーブルを結合するよい方法もありません。データのグループ化および集計はこのAPI からは利用できず、 そのためこれらの操作をサポートするには、すべてをクライアントサイドで実行しなければなりません。
  • SuiteQL は新しいAPI です。サービスとのSQL ライクな通信方法を実現するため、JOIN の機能はより豊富になり、GROUP BY や集計機能もサポートします。 加えて、抽出したいカラムだけを取得する機能も完全にサポートします。そのため、データを抽出する際のパフォーマンスがSuiteTalk より大幅に向上しています。ただし、サポートされるのはデータの抽出のみです。

NetSuite に接続するには、以下を行う必要があります。

  1. Schema を設定して、接続に使用するAPI を指定。データを取得するだけの場合は、SuiteQL の使用をお勧めします。データの取得および変更が必要な場合は、SuiteTalk の使用をお勧めします。
  2. 使用するAPI に適した接続オプションを設定します。(それぞれのAPI で利用可能な接続オプションが異なります。ヘルプドキュメントの「許可の設定」を参照してください。)

Netsuite への認証

SuiteTalk またはSuiteQL

NetSuite は3つの形式のOAuth 認証を提供します。

  • トークンベース認証(TBA)は、基本的にOAuth 1.0 で、OAuthAccessTokenOAuthAccessTokenSecret を実行時ではなくNetSuite UI 内で作成します。 TBA は、2020.2 以降のSuiteTalk およびSuiteQL の両方で利用可能です。
  • OAuth 2.0 認証は、SuiteQL でのみ利用できます。OAuth 2.0 認証を強制するには、次のいずれかを実行します。
    • OAuthVersion を使用するAPI に明示的に設定、または
    • SchemaSuiteQL に設定
  • OAuth JWT 認証は、OAuth 2.0 クライアント認証フローであり、クライアント認証情報を含むJWT を使用してNetSuite データへのアクセスを要求します。この認証方法は、SchemaSuiteQL に設定されている場合にのみ使用できます。

認証方法の詳細はヘルプドキュメントの「はじめに」を参照してください。

NetSuite をクエリするSQL 文の作成

NetSuite にはSQL でデータアクセスが可能です。SalesOrder エンティティからのデータを読み出します。

sql = "SELECT CustomerName, SalesOrderTotal FROM SalesOrder WHERE Class_Name = 'Furniture : Office'"

NetSuite データ のETL 処理

DataFrame に格納されたクエリ結果を使って、petl でETL(抽出・変換・ロード)パイプラインを組みます。この例では、NetSuite のデータ を取得して、SalesOrderTotal カラムでデータをソートして、CSV ファイルにデータをロードします。

table1 = etl.fromdb(cnxn,sql)

table2 = etl.sort(table1,'SalesOrderTotal')

etl.tocsv(table2,'salesorder_data.csv')

CData Python Connector for NetSuite を使えば、データベースを扱う場合と同感覚で、NetSuite のデータ を扱うことができ、petl のようなETL パッケージから直接データにアクセスが可能になります。

おわりに

NetSuite Python Connector の30日の無償トライアル をぜひダウンロードして、NetSuite のデータ への接続をPython アプリやスクリプトから簡単に作成しましょう。



フルソースコード

import petl as etl
import pandas as pd
import cdata.netsuite as mod

cnxn = mod.connect("Account Id=XABC123456;Password=password;User=user;Role Id=3;Version=2013_1;")

sql = "SELECT CustomerName, SalesOrderTotal FROM SalesOrder WHERE Class_Name = 'Furniture : Office'"

table1 = etl.fromdb(cnxn,sql)

table2 = etl.sort(table1,'SalesOrderTotal')

etl.tocsv(table2,'salesorder_data.csv')

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。