人工知能を研究するOpenAIが提供するChatGPTとTiDBを組み合わせて開発した革新的な自然言語クエリジェネレータである「Chat2Query (チャット・ツー・クエリ) 」について紹介できることを大変嬉しく思います。Chat2Queryを使えば、もはやデータの抽出や集計のためにSQLの専門家である必要はありません。TiDB Cloud Serverless Tierにサインインし、ブラウザ上のウィンドウに質問を入力すると、あとはChat2Queryが強力なSQLクエリを生成して、必要な情報を取得します。
この記事では、Chat2Queryの始め方と、サンプルデータセットを通してより実践的な使用方法を紹介します。
単なるSQLジェネレータではないChat2Query
SQL言語に関する幅広い知識がなくてもSQLクエリを生成できるAI搭載のSQLジェネレータはいくつか存在します。 しかし、これらのツールは一般的に単純なクエリの生成に最も適しており、本番環境での使用はもちろんのこと、より複雑なタスクには適していないのが現状です。
Chat2Queryは、以下を搭載しています:
- 業界をリードする自然言語からコードへの処理モデル – OpenAIのGPT-3
- オンライントランザクションとオンライン分析機能を同じデータベースでサポートする分散型HTAPデータベースのTiDB
この2つの技術を用いることで、Chat2Queryは非常に複雑なクエリを処理でき、動的なデータセットにリアルタイムの分析を提供することができるのです。
使用例
以下の例では、Chat2Queryを使って異なるデータセットに対して2つのクエリを生成しています。
Carデータセットに対するクエリ
Web3データセットに対するクエリ
Chat2Queryを始めよう
Chat2QueryはTiDB Cloud Serverless Tierに統合された機能です。以下の手順で始めることができます:
ステップ1: Serverless Tierクラスタにサインインする。
メール、Googleアカウント、またはGitHubアカウントを使ってTiDB Cloudアカウントにサインアップします。20秒以内にServerless Tierクラスタが自動的に作成され、Chat2Queryのインターフェイスが表示されます。
ステップ 2: データセットを準備する。
サンプルデータセットを使ってChat2Queryを素早く試すか、自分のデータセットでインサイトを調べることもできます。
By default, you will query against the sample_data
table with four preset datasets – github_events
, global_fortune_500
, imdb_movie_ratings
, and sold_car_orders
.
- For starters, get your target datasets ready. If you don’t have any, you can get one from free dataset hosting websites such as Kaggle.
- Under the Schemas tab, click
...
to the right of the target database, and click Import Data to start importing your dataset either in local CSV format or from Amazon S3. In our case, we useeth-usdt
, the Ethereum/Tether crypto price dataset in CSV. - Follow the prompts to configure the import source and target and start importing. The time it takes varies depending on the size of the data. When the import is done, the import detail window is displayed.
ステップ3: Chat2Queryでインサイトを調べる。
- クエリを生成します。Chat2Queryエディターで、”- your question “と入力してEnterをクリックすると、AIがSQLでクエリを生成します。
- クエリを確認します。Tabキーを押してSQLを採用するか、採用する前に必要に応じて編集します。
- クエリを実行します。画面右上の再生ボタンをクリックします。ページ下部にクエリ結果が表示されます。
ページの下部に、クエリのログと結果がすぐに表示されます。出力例については、使用例をご参照ください。
セキュリティとプライバシーに配慮した設計
ユーザーデータのプライバシーとセキュリティは、当社の最優先事項です。私たちは、ユーザーが情報の保護について我々を信頼していることを理解しており、その責任を真剣に受け止めています。Chat2Queryは、TiDB Cloud上のクエリサービスとしてSQLを生成するためにユーザーのデータベーススキーマのみにアクセスしており、実際のデータにはアクセスしません。
留意点
Chat2Queryはまだ開発途中のプロジェクトであり、成長する余地がたくさんあります。使用する前に、注意して頂きたい留意点があります。
- 生成されたSQLは必ずしも100%正しいとは限らず、さらに微調整が必要な場合もあります。
- Chat2QueryのSQL文のサポートは限定的です。CREATE TABLEやDROP TABLEのような DDL文はまだサポートされていません。
今すぐChat2Queryをはじめる
Chat2Queryをはじめるには、こちらからアクセスしてください。Chat2Queryは現時点ではベータ版のため、今後さらに発展していきます。
TiDBを体験するには、無料サインアップよりTiDB Serverlessをお試しください。日本語ドキュメントのTiDBクイックスタートガイド、または無料オンライントレーニングのご利用をお勧めします。ご不明な点などございましたら、お問い合わせフォームよりご連絡ください。 また、GitHubにて問題を報告することもできます。
TiDB Cloud Dedicated
TiDB Cloudのエンタープライズ版。
専用VPC上に構築された専有DBaaSでAWSとGoogle Cloudで利用可能。
TiDB Cloud Serverless
TiDB Cloudのライト版。
TiDBの機能をフルマネージド環境で使用でき無料かつお客様の裁量で利用開始。