AIゲートウェイ
AIゲートウェイは、AIネイティブのGitLab Duo機能へのアクセスを提供するスタンドアロンサービスです。
GitLabは、クラウドを拠点とするAIゲートウェイのインスタンスを運用しています。このインスタンスは、GitLab.com、GitLab Self-Managed、GitLab Dedicatedで使用されます。
GitLab Duo Self-Hostedを介してGitLab Self-ManagedでセルフホストAIゲートウェイインスタンスを使用することもできます。
リージョンサポート
GitLab.com
GitLab.comの場合、ルーティングメカニズムは、ユーザーのインスタンスの場所ではなく、GitLabインスタンスの場所に基づいています。
GitLab.comはus-east1にシングルホームであるため、AIゲートウェイへのリクエストは、ほとんどの場合us-east4にルーティングされます。ルーティングの結果が、すべてのユーザーにとって最も近いデプロイになるとは限りません。
GitLab Self-ManagedおよびGitLab Dedicatedの場合
GitLab Self-ManagedおよびGitLab Dedicatedの場合、GitLabがリージョンの選択を管理します。詳細については、Runwayサービスマニフェストの利用可能なリージョンを参照してください。
RunwayはGitLabの社内デベロッパープラットフォームであり、外部の顧客は利用できません。
データの自動ルーティング
GitLabは、CloudflareとGoogle Cloud Platform(GCP)ロードバランサーを使用して、AIゲートウェイリクエストを最も近い利用可能なデプロイに自動的にルーティングします。このルーティングメカニズムは、低レイテンシーとユーザーリクエストの効率的な処理を優先します。
このルーティングプロセスを手動で制御することはできません。データがルーティングされる場所に影響を与える要因は次のとおりです:
- ネットワークレイテンシー: 主要なルーティングメカニズムは、レイテンシーを最小限に抑えることに重点を置いています。ネットワークの状態によっては、データが最も近いリージョン以外のリージョンで処理される場合があります。
- サービスの可用性: リージョンの停止またはサービスの中断が発生した場合、中断のないサービスを確保するために、リクエストが自動的に再ルーティングされる場合があります。
- サードパーティの依存関係: GitLabのAIインフラストラクチャは、Google Vertex AIなどのサードパーティモデルプロバイダーに依存しており、これらは独自のデータ処理方法を持っています。
ダイレクト接続とインダイレクト接続
IDEは、デフォルトでGitLabモノリスをバイパスして、AIゲートウェイと直接通信します。このダイレクト接続により、ルーティング効率が向上します。
この動作を変更するには、直接接続および間接接続を設定します。
特定のリージョンへのリクエストをトレースする
特定のリージョンへのAIリクエストを直接トレースすることはできません。
特定のリクエストのトレーシングについてサポートが必要な場合、GitLabサポートがCloudflareヘッダーとインスタンスのUUIDを含むログにアクセスして分析できます。これらのログは、ルーティングパスに関するインサイトを提供し、リクエストが処理されたリージョンを特定するのに役立ちます。
データ主権
マルチリージョンAIゲートウェイデプロイでは、厳密なデータレジデンシーは適用されません。リクエストが特定のリージョンに移動または留まることは保証されていません。
このサービスは、データレジデンシーソリューションではありません。
デプロイリージョン
GitLabは、次のリージョンにAIゲートウェイをデプロイします:
- 北米(
us-east4) - ヨーロッパ(
europe-west2、europe-west3、およびeurope-west9) - アジア太平洋(
asia-northeast1およびasia-northeast3)
最新の情報については、Runway設定ファイルを参照してください。
AIゲートウェイで使用されるLLMモデルの正確な場所は、サードパーティのモデルプロバイダーによって決定されます。モデルが、AIゲートウェイデプロイと同じ地理的リージョンに存在することは保証されていません。AIゲートウェイが別のリージョンで最初のリクエストを処理する場合でも、データはモデルプロバイダーが運用する他のリージョンに流れる可能性があります。データは、パフォーマンスと可用性に基づいて、最適なリージョンにルーティングされます。