正式なドキュメントは英語版であり、この日本語訳はAI支援翻訳により作成された参考用のものです。日本語訳の一部の内容は人間によるレビューがまだ行われていないため、翻訳のタイミングにより英語版との間に差異が生じることがあります。最新かつ正確な情報については、英語版をご参照ください。

AIゲートウェイ

AIゲートウェイは、AIネイティブなGitLab Duo機能へのアクセスを提供するスタンドアロンサービスです。

GitLabは、クラウドベースのAIゲートウェイのインスタンスを運用しています。このインスタンスは、GitLab.com、GitLab Self-Managed、GitLab Dedicatedで使用されます。

セルフマネージドGitLabでは、GitLab Duo Self-Hostedを通じてセルフホスト型のAIゲートウェイインスタンスも使用できます。

リージョンサポート

GitLab.com

GitLab.comの場合、ルーティングメカニズムは、ユーザーのインスタンスの場所ではなく、GitLabインスタンスの場所に基づいています。

GitLab.comがus-east1でシングルホームであるため、ほとんどの場合、AIゲートウェイへのリクエストはus-east4にルーティングされます。そのため、すべてのユーザーが常に最も近いデプロイ先に接続されるとは限りません。

GitLab Self-ManagedおよびGitLab Dedicatedの場合

GitLab Self-ManagedおよびGitLab Dedicatedの場合、GitLabがリージョンの選択を管理します。AIゲートウェイのデプロイリージョンを選択することはできません。詳細については、Runwayサービスマニフェストの利用可能なリージョンを参照してください。

RunwayはGitLabの社内デベロッパープラットフォームであり、外部のお客様は利用できません。

データの自動ルーティング

GitLabは、CloudflareとGoogle Cloud Platform(GCP)ロードバランサーを使用して、AIゲートウェイリクエストを最も近い利用可能なデプロイに自動的にルーティングします。このルーティングメカニズムは、低レイテンシーとユーザーリクエストの効率的な処理を優先します。

このルーティングプロセスを手動で制御することはできません。次の要因は、データルーティング先に影響を与えます:

  • ネットワークレイテンシー: 主要なルーティングメカニズムは、レイテンシーを最小限に抑えることに重点を置いています。ネットワークの状態によっては、データが最も近いリージョン以外のリージョンで処理される場合があります。
  • サービスの可用性: リージョンの停止またはサービスの中断が発生した場合、サービスを中断しないために、リクエストが自動的に再ルーティングされる場合があります。
  • サードパーティの依存関係: GitLabのAIインフラストラクチャは、Google Vertex AIなどのサードパーティモデルプロバイダーに依存しており、これらは独自のデータ処理方法を採用しています。

ダイレクト接続とインダイレクト接続

IDEはデフォルトでAIゲートウェイと直接通信し、GitLabモノリスをバイパスしています。このダイレクト接続により、ルーティング効率が向上します。

この動作を変更するには、コード提案のdirect and indirect connectionsを設定してください。

特定のリージョンへのリクエストをトレースする

特定のリージョンへのAIリクエストを直接トレースすることはできません。

特定のリクエストのトレーシングについてサポートが必要な場合、GitLabサポートがCloudflareヘッダーとインスタンスのUUIDを含むログにアクセスして分析できます。これらのログは、ルーティングパスに関するインサイトを提供し、リクエストが処理されたリージョンを特定するのに役立ちます。

データ主権

マルチリージョンのAIゲートウェイデプロイは、厳格なデータ主権を強制しません。リクエストが特定のリージョンに移動または留まることは保証されていません。

このサービスは、データレジデンシーソリューションではありません。

デプロイリージョン

GitLabは、次のリージョンにAIゲートウェイをデプロイしています:

  • 北米(us-east4
  • ヨーロッパ(europe-west2europe-west3、およびeurope-west9
  • アジア太平洋(asia-northeast1およびasia-northeast3

最新の情報については、Runway設定ファイルを参照してください。

AIゲートウェイで使用される大規模言語モデルの正確な場所は、サードパーティのモデルプロバイダーによって決定されます。モデルは、AIゲートウェイのデプロイと同じ地理的リージョンに存在することは保証されていません。AIゲートウェイが最初のリクエストを別のリージョンで処理する場合でも、モデルプロバイダーが運用する他のリージョンにデータが流れる可能性があります。データは、パフォーマンスと可用性に基づいて、最適なリージョンにルーティングされます。