正式なドキュメントは英語版であり、この日本語訳はAI支援翻訳により作成された参考用のものです。日本語訳の一部の内容は人間によるレビューがまだ行われていないため、翻訳のタイミングにより英語版との間に差異が生じることがあります。最新かつ正確な情報については、英語版をご参照ください。

AIゲートウェイ

AIゲートウェイは、AIネイティブのGitLab Duo機能へのアクセスを提供するスタンドアロンサービスです。

GitLabは、クラウドを拠点とするAIゲートウェイのインスタンスを運用しています。このインスタンスは、GitLab.com、GitLab Self-Managed、GitLab Dedicatedで使用されます。

GitLab Duo Self-Hostedを介してGitLab Self-ManagedでセルフホストAIゲートウェイインスタンスを使用することもできます。

リージョンサポート

GitLab.com

GitLab.comの場合、ルーティングメカニズムは、ユーザーのインスタンスの場所ではなく、GitLabインスタンスの場所に基づいています。

GitLab.comはus-east1にシングルホームであるため、AIゲートウェイへのリクエストは、ほとんどの場合us-east4にルーティングされます。ルーティングの結果が、すべてのユーザーにとって最も近いデプロイになるとは限りません。

GitLab Self-ManagedおよびGitLab Dedicatedの場合

GitLab Self-ManagedおよびGitLab Dedicatedの場合、GitLabがリージョンの選択を管理します。詳細については、Runwayサービスマニフェストの利用可能なリージョンを参照してください。

RunwayはGitLabの社内デベロッパープラットフォームであり、外部の顧客は利用できません。

データの自動ルーティング

GitLabは、CloudflareとGoogle Cloud Platform(GCP)ロードバランサーを使用して、AIゲートウェイリクエストを最も近い利用可能なデプロイに自動的にルーティングします。このルーティングメカニズムは、低レイテンシーとユーザーリクエストの効率的な処理を優先します。

このルーティングプロセスを手動で制御することはできません。データがルーティングされる場所に影響を与える要因は次のとおりです:

  • ネットワークレイテンシー: 主要なルーティングメカニズムは、レイテンシーを最小限に抑えることに重点を置いています。ネットワークの状態によっては、データが最も近いリージョン以外のリージョンで処理される場合があります。
  • サービスの可用性: リージョンの停止またはサービスの中断が発生した場合、中断のないサービスを確保するために、リクエストが自動的に再ルーティングされる場合があります。
  • サードパーティの依存関係: GitLabのAIインフラストラクチャは、Google Vertex AIなどのサードパーティモデルプロバイダーに依存しており、これらは独自のデータ処理方法を持っています。

ダイレクト接続とインダイレクト接続

IDEは、デフォルトでGitLabモノリスをバイパスして、AIゲートウェイと直接通信します。このダイレクト接続により、ルーティング効率が向上します。

この動作を変更するには、直接接続および間接接続を設定します。

特定のリージョンへのリクエストをトレースする

特定のリージョンへのAIリクエストを直接トレースすることはできません。

特定のリクエストのトレーシングについてサポートが必要な場合、GitLabサポートがCloudflareヘッダーとインスタンスのUUIDを含むログにアクセスして分析できます。これらのログは、ルーティングパスに関するインサイトを提供し、リクエストが処理されたリージョンを特定するのに役立ちます。

データ主権

マルチリージョンAIゲートウェイデプロイでは、厳密なデータレジデンシーは適用されません。リクエストが特定のリージョンに移動または留まることは保証されていません。

このサービスは、データレジデンシーソリューションではありません。

デプロイリージョン

GitLabは、次のリージョンにAIゲートウェイをデプロイします:

  • 北米(us-east4
  • ヨーロッパ(europe-west2europe-west3、およびeurope-west9
  • アジア太平洋(asia-northeast1およびasia-northeast3

最新の情報については、Runway設定ファイルを参照してください。

AIゲートウェイで使用されるLLMモデルの正確な場所は、サードパーティのモデルプロバイダーによって決定されます。モデルが、AIゲートウェイデプロイと同じ地理的リージョンに存在することは保証されていません。AIゲートウェイが別のリージョンで最初のリクエストを処理する場合でも、データはモデルプロバイダーが運用する他のリージョンに流れる可能性があります。データは、パフォーマンスと可用性に基づいて、最適なリージョンにルーティングされます。