ベクトルエンベディングを使用する

MySQL | PostgreSQL | SQL Server

このページでは、Cloud SQL for PostgreSQL を使用して次の操作を行う方法について説明します。

モデルに基づいてベクトルエンベディングを生成し、保存する。
pgvector 拡張機能を使用して、エンベディングをインデックスに登録し、クエリする。

詳細については、Cloud SQL を使用して生成 AI アプリケーションを作成するをご覧ください。

Cloud SQL では、Vertex AI でホストされているエンベディングモデルを使用して、テキスト文字列をエンベディングに変換できます。エンベディングは、特定のテキストの意味を数値ベクトルとして表したモデル表現です。

Cloud SQL は、real 値の配列としてエンベディングを実装します。生成されたエンベディングは pgvector 拡張関数の入力として使用できます。

始める前に

一部の要件は、Cloud SQL を使用してエンベディングを生成するのか、別のソースからデータベースに保存されているエンベディングのみを処理する必要があるかによって異なります。

リージョンの制約事項

Cloud SQL でエンベディングを生成するには、インスタンスが generative AI foundational models are supported のリージョンに存在する必要があります。このリージョンに、Cloud SQL がエンベディングに使用できる Vertex AI モデル（textembedding-gecko）が存在します。

必要なデータベース拡張機能

エンベディングを使用するには、Cloud SQL インスタンスに google_ml_integration 拡張機能（バージョン 1.2 以降）をインストールする必要があります。

必要に応じて、これらのエンベディングを保存し、エンベディングでベクトル関数と演算子を使用する場合は、pgvector 拡張機能も必要です。

Cloud SQL は、この両方の拡張機能を備えています。これらは、インスタンス内の任意のデータベースにインストールできます。詳細については、PostgreSQL 拡張機能を構成するをご覧ください。

モデルへのアクセスを設定する

Cloud SQL インスタンスからエンベディングを生成するには、テキストエンベディングモデルを使用するように Cloud SQL を構成する必要があります。

クラウドベースの textembeddings-gecko モデルを使用するには、Cloud SQL を Vertex AI と統合する必要があります。

データベースユーザーにエンベディングの生成権限を付与する

データベースユーザーに、embedding 関数を使用して予測を実行する権限を付与します。

psql クライアントを使用して接続するの説明に従って、psql クライアントをプライマリインスタンスに接続します。
psql コマンドプロンプトで、データベースに接続して権限を付与します。
```
\c DB_NAME

GRANT EXECUTE ON FUNCTION embedding TO USER_NAME;
```
次のように置き換えます。
- DB_NAME: 権限を付与するデータベースの名前
- USER_NAME: 権限を付与するユーザーの名前

エンベディングを生成する

Cloud SQL には、テキストをベクトルエンベディングに変換する関数があります。このエンベディングをベクトルデータとしてデータベースに保存し、必要に応じて pgvector 関数を使用してクエリを実行します。

エンベディングを生成する

Cloud SQL を使用してエンベディングを生成するには、google_ml_integration 拡張機能が提供する embedding() 関数を使用します。

SELECT embedding( 'MODEL_IDVERSION_TAG', 'TEXT');

次の項目を置き換えます。

MODEL_ID: クエリするモデルの ID。

Vertex AI Model Garden を使用している場合は、textembedding-gecko または
textembedding-gecko-multilingual を指定します。これらは、Cloud SQL がテキストエンベディングに使用できるクラウドベースのモデルです。詳細については、テキストエンベディングをご覧ください。
VERSION_TAG（省略可）: クエリするモデルのバージョンタグ。タグの前に @ を付けます。

Vertex AI で textembedding-gecko モデルのいずれかを使用している場合は、モデルバージョンに記載されているバージョンタグのいずれかを指定します。

バージョンタグを指定することを強くおすすめします。
TEXT: ベクトルエンベディングに変換するテキスト。

次の例では、textembedding-gecko モデルのバージョン 001 を使用して、指定されたリテラル文字列に基づいてエンベディングを生成します。

SELECT embedding( 'textembedding-gecko@001', 'Cloud SQL is a managed, cloud-hosted SQL database service.');

生成されたエンベディングを保存する

embedding() 関数の戻り値は、real 値の配列です。この値をテーブルに保存するには、real[] 列を追加します。

ALTER TABLE TABLE ADD COLUMN EMBEDDING_COLUMN real[DIMENSIONS];

次の項目を置き換えます。

TABLE: テーブル名
EMBEDDING_COLUMN: 新しいエンベディング列の名前
DIMENSIONS: モデルがサポートするディメンションの数。

Vertex AI で textembedding-gecko モデルのいずれかを使用している場合は、768 を指定します。

省略可: pgvector 拡張機能をインストールしている場合は、エンベディングを vector 値として保存できます。

ALTER TABLE TABLE ADD COLUMN EMBEDDING_COLUMN vector(DIMENSIONS);

エンベディングを格納する列を作成したら、同じテーブルの別の列にすでに格納されている値に基づいてデータを入力できます。

UPDATE TABLE SET EMBEDDING_COLUMN = embedding('MODEL_IDVERSION_TAG', SOURCE_TEXT_COLUMN);

次の項目を置き換えます。

TABLE: テーブル名。
EMBEDDING_COLUMN: エンベディング列の名前。
MODEL_ID: クエリするモデルの ID。

Vertex AI Model Garden を使用している場合は、textembedding-gecko または
textembedding-gecko-multilingual を指定します。これらは、Cloud SQL がテキストエンベディングに使用できるクラウドベースのモデルです。詳細については、テキストエンベディングをご覧ください。
VERSION_TAG（省略可）: クエリするモデルのバージョンタグ。タグの前に @ を付けます。

Vertex AI で textembedding-gecko モデルのいずれかを使用している場合は、モデルバージョンに記載されているバージョンタグのいずれかを指定します。

バージョンタグを指定することを強くおすすめします。これを行わないと、予期しない結果が生じる可能性があります。
SOURCE_TEXT_COLUMN: テキストを格納している列の名前。このテキストをエンベディングに変換します。

上記のコマンドは、real[] と vector の両方のエンベディング列で機能します。エンベディング列が vector 型の場合、Cloud SQL は embedding() の戻り値を real 配列から vector 値に暗黙的にキャストします。

次の例では、textembedding-gecko モデルのバージョン 001 を使用して、messages.message 列の内容に基づいてエンベディングを messages.message_vector 列に入力します。

UPDATE messages SET message_vector = embedding( 'textembedding-gecko@001', message);

`pgvector` を使用してエンベディングをクエリしてインデックスに登録する

pgvector PostgreSQL 拡張機能を使用すると、データベースに対してテキストエンベディングの保存、インデックス登録、クエリを行う際に、ベクトル固有の演算子と関数を使用できます。Cloud SQL には、pgvector を処理するための独自の最適化が用意されており、エンベディングを含むクエリを高速化できるインデックスを作成できます。

最適化された最近傍インデックスを作成する

pgvector は、インデックス登録による近似最近傍検索をサポートしています。Cloud SQL では、インデックス作成時に指定できるスカラー量子化機能により、このサポートが強化されています。この機能を有効にすると、スカラー量子化により、次元ベクトルが大きいクエリを高速化できます。また、この機能を使用すると、最大 8,000 個のディメンションを持つベクトルを保存できます。

pgvector ベースのインデックスでスカラー量子化を有効にするには、インデックスの改善方法として ivf を指定します。また、量子化器として SQ8 を指定します。

CREATE INDEX ON TABLE
  USING ivf (EMBEDDING_COLUMN DISTANCE_FUNCTION)
  WITH (lists = LIST_COUNT, quantizer = 'SQ8');

次の項目を置き換えます。

TABLE: インデックスを追加するテーブル。
EMBEDDING_COLUMN: vector データを格納する列。
DISTANCE_FUNCTION: このインデックスで使用する距離関数。次のいずれかを選択します。
- L2 距離: vector_l2_ops
- 内積: vector_ip_ops
- コサイン距離: vector_cosine_ops
LIST_COUNT: このインデックスで使用するリストの数。

このインデックスを、vector ではなく real[] データ型を使用するエンベディング列に作成するには、列を vector データ型にキャストします。

CREATE INDEX ON TABLE
  USING ivf ((CAST(EMBEDDING_COLUMN AS vector(DIMENSIONS)))'}} DISTANCE_FUNCTION)
  WITH (lists = LIST_COUNT, quantizer = 'SQ8');

DIMENSIONS は、エンベディング列のディメンション幅に置き換えます。

次のセクションでは、このようなインデックスの例を示します。

指定されたテキストで類似クエリを作成する

エンベディングをデータベースに保存してインデックスを作成すると、pgvector クエリ機能の全範囲が使用可能になります。

テキストに最も近いセマンティックネイバーを見つけるには、embedding() 関数を使用して、テキストをベクトルに変換します。同じクエリで、このベクトルを pgvector 最近傍演算子 <-> に適用し、意味的に最も類似したエンベディングを含むデータベース行を見つけます。

embedding() は real 配列を返すため、これらの値を pgvector 演算子で使用するには、embedding() 呼び出しを vector にキャストする必要があります。

  SELECT RESULT_COLUMNS FROM TABLE
    ORDER BY EMBEDDING_COLUMN
    <-> embedding('MODEL_IDVERSION_TAG', 'TEXT')::vector
    LIMIT ROW_COUNT

次の項目を置き換えます。

RESULT_COLUMNS: 意味的に類似した行から表示する列。
TABLE: テキストを比較するエンベディングを含むテーブル。
EMBEDDING_COLUMN: 保存されたエンベディングを含む列。
MODEL_ID: クエリするモデルの ID。

Vertex AI Model Garden を使用している場合は、textembedding-gecko または
textembedding-gecko-multilingual を指定します。これらは、Cloud SQL がテキストエンベディングに使用できるクラウドベースのモデルです。詳細については、テキストエンベディングをご覧ください。
VERSION_TAG（省略可）: クエリするモデルのバージョンタグ。タグの前に @ を付けます。

Vertex AI で textembedding-gecko モデルのいずれかを使用している場合は、モデルバージョンに記載されているバージョンタグのいずれかを指定します。

バージョンタグを指定することを強くおすすめします。これを行わないと、予期しない結果が生じる可能性があります。
TEXT: 最も近い保存済みセマンティックネイバーを見つけるために必要なテキスト。
ROW_COUNT: 返される行数。最良の一致が 1 つだけ必要な場合は、このパラメータの値として 1 を指定します。

このクエリを vector ではなく、real[] データ型を使用する保存済みエンベディング列で実行するには、列を vector データ型にキャストします。

  SELECT RESULT_COLUMNS::vector FROM TABLE
    ORDER BY EMBEDDING_COLUMN
    <-> embedding('MODEL_IDVERSION_TAG', 'TEXT')::vector
    LIMIT ROW_COUNT

モデルバージョンタグを使用してエラーを回避する

選択したエンベディングモデルの安定版を常に使用することを強くおすすめします。ほとんどのモデルでは、バージョンタグは明示的に設定されています。

モデルのバージョンタグを指定せずに embedding() 関数を呼び出すことは、構文的には可能ですが、エラーが発生しやすくなります。

Vertex AI Model Garden でモデルを使用するときにバージョンタグを省略すると、Vertex AI はモデルの最新バージョンを使用します。これは最新の安定版ではない可能性があります。使用可能な Vertex AI モデルバージョンの詳細については、モデルバージョンをご覧ください。

特定の Vertex AI モデルバージョンは、特定のテキスト入力に対して常に同じ embedding() レスポンスを返します。embedding() の呼び出しでモデルバージョンを指定しないと、新しい公開モデルバージョンによって、特定の入力に対する返されるベクトルが突然変更される可能性があります。これにより、アプリでエラーや予期しない動作が発生する可能性があります。

このような問題を回避するため、常にモデルバージョンを指定してください。

ベクトル エンベディングを使用する

始める前に

リージョンの制約事項

必要なデータベース拡張機能

モデルへのアクセスを設定する

データベース ユーザーにエンベディングの生成権限を付与する

エンベディングを生成する

エンベディングを生成する

生成されたエンベディングを保存する

pgvector を使用してエンベディングをクエリしてインデックスに登録する

最適化された最近傍インデックスを作成する

指定されたテキストで類似クエリを作成する

モデル バージョン タグを使用してエラーを回避する

次のステップ

ベクトルエンベディングを使用する

データベースユーザーにエンベディングの生成権限を付与する

`pgvector` を使用してエンベディングをクエリしてインデックスに登録する

モデルバージョンタグを使用してエラーを回避する