ChatGPT の背後にあるテクノロジーである Pre-trained Transformer 3 ( GPT-3 ) と、分散 SQL データベースである TiDB を搭載した革新的な自然言語クエリ ジェネレーターであるChat2Query (ベータ版) を紹介できることを嬉しく思います。
Chat2Query を使用すると、SQL の専門家でなくてもデータから洞察を引き出すことができます。質問をするだけで、あとは AI ツールが処理し、洞察を取得するための強力な SQL クエリを生成します。 OpenAIと TiDB を組み合わせることで、AI を利用してデータベースを革新し、データ探索を支援し、ビジネス上の意思決定を即座に行うためのリアルタイムで実用的な洞察を提供します。
この投稿では、AI を利用した Chat2Query の使用を開始し、サンプル データセットと独自のデータセットを通じて分析情報を探索する方法を紹介します。
単なる AI を活用した SQL ジェネレーター以上のもの
はい。SQL 言語に関する広範な知識がなくても、ユーザーが SQL クエリを生成するのに役立つ AI を利用した SQL ジェネレーターがいくつか利用可能です。ただし、これらの AI ツールは単純なクエリの生成に最適です。つまり、より複雑なタスクや本番環境での使用には適していない可能性があります。
Chat2Query は以下によって提供されます。
- OpenAI の GPT3 は、業界をリードする自然言語からコードへの処理モデルであり、バイラルな ChatGPT の背後にあるテクノロジです。
- TiDB Cloud Serverless Tier は、ハイブリッド トランザクションおよび分析処理 (HTAP) データベース サービスであり、開発者がサーバー インフラストラクチャを管理することなく、最もコスト効率の高い方法でインフラストラクチャを大規模に展開できるようにします。
これら 2 つのテクノロジを使用することで、 Chat2Query は最も複雑なクエリを処理し、動的データセットにリアルタイムの洞察を提供できます。
サンプル ユース ケースの探索
次の例では、Chat2Query を使用して、異なるデータセットに対して 2 つのクエリを生成します。
Netflix データセットに対するクエリ – Netflix のベスト 10 タイトルを教えてください。
Web3 データセットに対するクエリ – 昨年のどの月に最大のボリュームが発生したか
Chat2Query の使用を開始する
Chat2Query は、TiDB Cloud Serverless Tier に統合された機能です。開始するには、次の手順を実行できます。
ステップ 1: Serverless Tier クラスターにサインインします。
メール、Google アカウント、または GitHub アカウントを使用して、TiDB Cloud アカウントにサインアップします。 Serverless Tier クラスターは 20 秒以内に自動的に作成され、Chat2Query インターフェイスに移動します。
ステップ 2: データセットを準備します。
サンプル データセットを使用して、Chat2Query をすばやく探索するか、独自のデータセットで分析情報を探索することができます。
サンプル データセットの使用
デフォルトでは、4 つのプリセット データセット ( github_events
、 global_fortune_500
、 imdb_movie_ratings
、およびsold_car_orders
を使用して、 sample_data
テーブルに対してクエリを実行します。
データセットの使用
まず、ターゲット データセットを準備します。持っていない場合は、 Kaggleなどの無料のデータセット ホスティング Web サイトから入手できます。
[スキーマ]タブで、ターゲット データベースの右側にある
...
をクリックし、 [データのインポート]をクリックして、ローカルの CSV 形式または Amazon S3 からデータセットのインポートを開始します。この場合、CSV の Ethereum/Tether 暗号価格データセットであるeth-usdt
を使用します。
プロンプトに従ってインポート ソースとターゲットを構成し、インポートを開始します。かかる時間は、データのサイズによって異なります。インポートが完了すると、インポートの詳細ウィンドウが表示されます。
ステップ 3: Chat2Query を使用してインサイトを探索します。
- クエリを生成します。 Chat2Query エディターで、「– ご質問」と入力し、 Enterをクリックして、AI が SQL でクエリを生成できるようにします。
- クエリを確認します。 Tabキーを押して SQL を受け入れるか、受け入れる前に必要に応じて編集します。
- クエリを実行します。画面の右上隅にある再生ボタンをクリックします。クエリ結果はページの下部に表示されます。
- ページの下部にクエリ ログと結果がすぐに表示されます。出力例については、使用例の探索を参照してください。
セキュリティとプライバシーを備えた構築
ユーザーデータのプライバシーとセキュリティは、私たちの最優先事項です。私たちは、ユーザーが自分の情報を保護するために私たちを信頼していることを理解しており、その責任を真剣に受け止めています。 TiDB クラウドのクエリ サービスとして、Chat2Query はデータベース スキーマにアクセスして SQL を生成するだけでよく、実際のデータにはアクセスしません。
制限事項
ベータ プロジェクトとして、Chat2Query はまだ開発中であり、改善の余地がたくさんあります。
したがって、次の 2 つの制限事項に注意してください。
- AI によって生成された SQL は常に 100% 正しいとは限らず、さらに調整が必要になる場合があります。
- Chat2Query では、SQL ステートメントのサポートが制限されています。
CREATE TABLE
やDROP TABLE
などの DDL ステートメントはまだサポートされていません。
今日Chat2Queryを始めましょう
早期アクセスはこちらから入手できます。このクエリ ツールをさらに改善するために、フィードバックをお待ちしております。
それまでの間、Chat2Query は急速に開発されています。進行状況の最新情報を入手するには、 Twitterでフォローしてください。
記事について質問やコメントがありますか? TiDB フォーラムにアクセス
こちらにも掲載