AIゲートウェイ

AIゲートウェイは、AIネイティブなGitLab Duo機能へのアクセスを提供するスタンドアロンサービスです。

GitLabは、クラウドベースのAIゲートウェイのインスタンスを運用しています。このインスタンスは、GitLab.com、GitLab Self-Managed、GitLab Dedicatedで使用されます。

セルフマネージドGitLabでは、GitLab Duo Self-Hostedを通じてセルフホスト型のAIゲートウェイインスタンスも使用できます。

リージョンサポート

GitLab.com

GitLab.comの場合、ルーティングメカニズムは、ユーザーのインスタンスの場所ではなく、GitLabインスタンスの場所に基づいています。

GitLab.comがus-east1でシングルホームであるため、ほとんどの場合、AIゲートウェイへのリクエストはus-east4にルーティングされます。そのため、すべてのユーザーが常に最も近いデプロイ先に接続されるとは限りません。

GitLab Self-ManagedおよびGitLab Dedicatedの場合

GitLab Self-ManagedおよびGitLab Dedicatedの場合、GitLabがリージョンの選択を管理します。AIゲートウェイのデプロイリージョンを選択することはできません。詳細については、Runwayサービスマニフェストの利用可能なリージョンを参照してください。

RunwayはGitLabの社内デベロッパープラットフォームであり、外部のお客様は利用できません。

データの自動ルーティング

GitLabは、CloudflareとGoogle Cloud Platform（GCP）ロードバランサーを使用して、AIゲートウェイリクエストを最も近い利用可能なデプロイに自動的にルーティングします。このルーティングメカニズムは、低レイテンシーとユーザーリクエストの効率的な処理を優先します。

このルーティングプロセスを手動で制御することはできません。次の要因は、データルーティング先に影響を与えます:

ネットワークレイテンシー: 主要なルーティングメカニズムは、レイテンシーを最小限に抑えることに重点を置いています。ネットワークの状態によっては、データが最も近いリージョン以外のリージョンで処理される場合があります。
サービスの可用性: リージョンの停止またはサービスの中断が発生した場合、サービスを中断しないために、リクエストが自動的に再ルーティングされる場合があります。
サードパーティの依存関係: GitLabのAIインフラストラクチャは、Google Vertex AIなどのサードパーティモデルプロバイダーに依存しており、これらは独自のデータ処理方法を採用しています。

ダイレクト接続とインダイレクト接続

IDEはデフォルトでAIゲートウェイと直接通信し、GitLabモノリスをバイパスしています。このダイレクト接続により、ルーティング効率が向上します。

コード提案向けに直接接続と間接接続を設定することで、この動作を変更できます。

特定のリージョンへのリクエストをトレースする

特定のリージョンへのAIリクエストを直接トレースすることはできません。

特定のリクエストのトレーシングについてサポートが必要な場合、GitLabサポートがCloudflareヘッダーとインスタンスのUUIDを含むログにアクセスして分析できます。これらのログは、ルーティングパスに関するインサイトを提供し、リクエストが処理されたリージョンを特定するのに役立ちます。

データ主権

マルチリージョンのAIゲートウェイデプロイは、厳格なデータ主権を強制しません。リクエストが特定のリージョンに移動または留まることは保証されていません。

このサービスは、データレジデンシーソリューションではありません。

デプロイリージョン

GitLabは、次のリージョンにAIゲートウェイをデプロイしています:

北米（us-east4）
ヨーロッパ（europe-west2、europe-west3、およびeurope-west9）
アジア太平洋（asia-northeast1およびasia-northeast3）

最新の情報については、Runway設定ファイルを参照してください。

AIゲートウェイで使用される大規模言語モデルの正確な場所は、サードパーティのモデルプロバイダーによって決定されます。モデルは、AIゲートウェイのデプロイと同じ地理的リージョンに存在することは保証されていません。AIゲートウェイが最初のリクエストを別のリージョンで処理する場合でも、モデルプロバイダーが運用する他のリージョンにデータが流れる可能性があります。データは、パフォーマンスと可用性に基づいて、最適なリージョンにルーティングされます。