正式なドキュメントは英語版であり、この日本語訳はAI支援翻訳により作成された参考用のものです。日本語訳の一部の内容は人間によるレビューがまだ行われていないため、翻訳のタイミングにより英語版との間に差異が生じることがあります。最新かつ正確な情報については、英語版をご参照ください。

サポートされているGitLab Duoセルフホストモデルとハードウェア要件

  • プラン: Premium、Ultimate
  • アドオン: GitLab Duo Enterprise
  • 提供形態: GitLab Self-Managed

GitLab Duo Self-Hostedは、お好みのサービスプラットフォームを介して、Mistral、Meta、Anthropic、OpenAIの業界をリードするモデルとのインテグレーションをサポートしています。

これらのサポートされているモデルから、特定のパフォーマンスニーズとユースケースに合わせて選択できます。

GitLab 18.3以降では、独自の互換性のあるモデルを使用することもでき、公式にサポートされているオプション以外にも、追加の言語モデルを柔軟にスケールできます。

サポートされているモデル

GitLabでサポートされているモデルは、特定のモデルと機能の組み合わせに応じて、GitLab Duo機能に対してさまざまなレベルの機能を提供します。

  • 完全な機能: モデルは、品質を損なうことなく機能を処理できる可能性があります。
  • 部分的な機能: モデルは機能をサポートしていますが、妥協や制限がある可能性があります。
  • 制限された機能: モデルは機能には適しておらず、品質が大幅に低下したり、パフォーマンスの問題が発生したりする可能性があります。機能が制限されているモデルは、その特定の機能に対するGitLabサポートを受けられません。
モデルファミリーモデルサポートされているプラットフォームコード補完コード生成GitLab Duo ChatGitLab Duo Agent Platform
Mistral CodestralCodestral 22B v0.1vLLMcheck-circle-filled 完全な機能check-circle-filled 完全な機能check-circle-dashed 部分的な機能制限された機能
MistralMistral Small 24B Instruct 2506vLLMcheck-circle-filled 完全な機能check-circle-filled 完全な機能check-circle-filled 完全な機能制限された機能
Claude 3Claude 3.5 SonnetAWS Bedrockcheck-circle-filled 完全な機能check-circle-filled 完全な機能check-circle-filled 完全な機能check-circle-dashed 部分的な機能
Claude 3Claude 3.7 SonnetAWS Bedrockcheck-circle-filled 完全な機能check-circle-filled 完全な機能check-circle-filled 完全な機能check-circle-dashed 部分的な機能
Claude 4Claude 4 SonnetAWS Bedrockcheck-circle-filled 完全な機能check-circle-filled 完全な機能check-circle-filled 完全な機能check-circle-filled 完全な機能
GPTGPT-4 TurboAzure OpenAIcheck-circle-filled 完全な機能check-circle-filled 完全な機能check-circle-dashed 部分的な機能制限された機能
GPTGPT-4oAzure OpenAIcheck-circle-filled 完全な機能check-circle-filled 完全な機能check-circle-filled 完全な機能制限された機能
GPTGPT-4o-miniAzure OpenAIcheck-circle-filled 完全な機能check-circle-filled 完全な機能check-circle-dashed 部分的な機能制限された機能
GPTGPT-5)Azure OpenAIcheck-circle-filled 完全な機能check-circle-filled 完全な機能check-circle-filled 完全な機能制限された機能
GPTGPT-oss-120BvLLMcheck-circle-filled 完全な機能check-circle-filled 完全な機能check-circle-filled 完全な機能制限された機能
GPTGPT-oss-20BvLLMcheck-circle-dashed 部分的な機能check-circle-dashed 部分的な機能check-circle-dashed 部分的な機能制限された機能
LlamaLlama 3 8BvLLMcheck-circle-dashed 部分的な機能check-circle-filled 完全な機能dash-circle 制限された機能制限された機能
LlamaLlama 3.1 8BvLLMcheck-circle-dashed 部分的な機能check-circle-filled 完全な機能check-circle-dashed 部分的な機能制限された機能
LlamaLlama 3 70BvLLMcheck-circle-dashed 部分的な機能check-circle-filled 完全な機能dash-circle 制限された機能制限された機能
LlamaLlama 3.1 70BvLLMcheck-circle-filled 完全な機能check-circle-filled 完全な機能check-circle-filled 完全な機能制限された機能
LlamaLlama 3.3 70BvLLMcheck-circle-filled 完全な機能check-circle-filled 完全な機能check-circle-filled 完全な機能制限された機能

互換性のあるモデル

  • ステータス: ベータ

独自の互換性のあるモデルとプラットフォームをGitLab Duo機能で使用できます。サポートされているモデルファミリーに含まれていない互換性のあるモデルについては、一般的なモデルファミリーを使用してください。

互換性のあるモデルは、AI機能利用規約の顧客インテグレーションモデルの定義から除外するされます。互換性のあるモデルとプラットフォームは、OpenAI API仕様に準拠する必要があります。以前に実験的またはベータとしてマークされていたモデルとプラットフォームは、互換性のあるモデルと見なされるようになりました。

この機能はベータ版であるため、フィードバックを収集してインテグレーションを改善するにつれて変更される可能性があります:

  • GitLabは、選択したモデルまたはプラットフォームに固有の問題に対するテクニカルサポートを提供しません。
  • すべてのGitLab Duo機能が、すべての互換性のあるモデルで最適に動作することが保証されているわけではありません。
  • 応答の品質、速度、および全体的なパフォーマンスは、モデルの選択によって大きく異なる場合があります。
モデルファミリーモデル要件サポートされているプラットフォーム
一般OpenAI API仕様と互換性のあるモデルOpenAI互換のAPIエンドポイントを提供するプラットフォーム
CodeGemmaCodeGemma 2bvLLM
CodeGemmaCodeGemma 7b-itvLLM
CodeGemmaCodeGemma 7b-codevLLM
Code LlamaCode-Llama 13bvLLM
DeepSeek CoderDeepSeek Coder 33b InstructvLLM
DeepSeek CoderDeepSeek Coder 33b BasevLLM
MistralMistral 7B-it v0.2vLLM
AWS Bedrock
MistralMistral 7B-it v0.3 1vLLM
MistralMixtral 8x7B-it v0.1 1vLLMAWS Bedrock
MistralMixtral 8x22B-it v0.1 1vLLM

Footnotes(脚注):

  1. このモデルのサポートはGitLab 18.5で削除されました。代わりにMistral Small 24B Instruct 2506を使用する必要があります。

GitLab AIベンダーモデル

  • ステータス: ベータ

この機能の利用可否は、機能フラグによって制御されます。詳細については、履歴を参照してください。

GitLab AIベンダーモデルは、GitLabがホストするAIゲートウェイインフラストラクチャとインテグレーションし、GitLabがキュレーションして利用できるようにしたAIモデルへのアクセスを提供します。独自のセルフホストモデルを使用する代わりに、特定のGitLab Duo機能にGitLab AIベンダーモデルを使用することを選択できます。

どの機能でGitLab AIベンダーモデルを使用するかを選択するには、GitLab AIベンダーモデルの設定を参照してください。

特定の機能で有効になっている場合:

  • GitLab AIベンダーモデルで設定されたこれらの機能へのすべてのリクエストは、セルフホストモデルAIゲートウェイではなく、GitLabがホストするAIゲートウェイを使用します。
  • AIログが有効になっている場合でも、GitLabがホストするAIゲートウェイに詳細なログは生成されません。これにより、機密情報の意図しない漏洩を防ぐことができます。

ハードウェア要件

次のハードウェア仕様は、オンプレミスでGitLab Duo Self-Hostedを実行するための最小要件です。要件は、モデルサイズと目的のユースケースによって大きく異なります:

基本システム要件

  • CPU:
    • 最小: 8コア (16スレッド)
    • 次の操作を行うことをおすすめします: 本番環境では16以上のコア
  • RAM(RAM):
    • 最小: 32 GB
    • 次の操作を行うことをおすすめします: ほとんどのモデルで64GB
  • ストレージ:
    • モデルウェイトとデータに十分な容量を持つソリッドステートドライブ

モデルサイズ別のGPU要件

モデルサイズ最小GPU設定必要な最小VRAM
7Bモデル
(例: Mistral 7B)
1x NVIDIA A100 (40 GB)35 GB
22Bモデル
(例: Codestral 22B)
2x NVIDIA A100 (80 GB)110 GB
Mixtral 8x7B2x NVIDIA A100 (80 GB)220 GB
Mixtral 8x22B8x NVIDIA A100 (80 GB)526 GB

Hugging Faceのメモリユーティリティを使用して、メモリ要件を確認します。

モデルサイズとGPU別の応答時間

小型マシン

a2-highgpu-2g (2x Nvidia A100 40 GB - 150 GB vRAM) または同等のもの:

モデル名リクエスト数リクエストごとの平均時間 (秒)応答の平均トークンリクエストごとの1秒あたりの平均トークンリクエストの合計時間合計TPS
Mistral-7B-Instruct-v0.317.09717.0101.197.09101.17
Mistral-7B-Instruct-v0.3108.41764.290.3513.70557.80
Mistral-7B-Instruct-v0.310013.97693.2349.1720.813331.59

ミディアムマシン

a2-ultragpu-4g (4x Nvidia A100 40 GB - 340 GB vRAM) GCPまたは同等のマシン:

モデル名リクエスト数リクエストごとの平均時間 (秒)応答の平均トークンリクエストごとの1秒あたりの平均トークンリクエストの合計時間合計TPS
Mistral-7B-Instruct-v0.313.80499.0131.253.80131.23
Mistral-7B-Instruct-v0.3106.00740.6122.858.19904.22
Mistral-7B-Instruct-v0.310011.71695.7159.0615.544477.34
Mixtral-8x7B-Instruct-v0.116.50400.061.556.5061.53
Mixtral-8x7B-Instruct-v0.11016.58768.940.3332.56236.13
Mixtral-8x7B-Instruct-v0.110025.90767.3826.8755.571380.68

大型マシン

a2-ultragpu-8g (8 x NVIDIA A100 80 GB - 1360 GB vRAM) GCPまたは同等のマシン:

モデル名リクエスト数リクエストごとの平均時間 (秒)応答の平均トークンリクエストごとの1秒あたりの平均トークンリクエストの合計時間(秒)合計TPS
Mistral-7B-Instruct-v0.313.23479.0148.413.22148.36
Mistral-7B-Instruct-v0.3104.95678.3135.986.85989.11
Mistral-7B-Instruct-v0.310010.14713.2769.6313.965108.75
Mixtral-8x7B-Instruct-v0.116.08709.0116.696.07116.64
Mixtral-8x7B-Instruct-v0.1109.95645.063.6813.40481.06
Mixtral-8x7B-Instruct-v0.110013.83585.0141.8020.382869.12
Mixtral-8x22B-Instruct-v0.1114.39828.057.5614.3857.55
Mixtral-8x22B-Instruct-v0.11020.57629.730.2428.02224.71
Mixtral-8x22B-Instruct-v0.110027.58592.4921.3436.801609.85

AIゲートウェイのハードウェア要件

AIゲートウェイのハードウェアに関する推奨事項については、AIゲートウェイのスケールに関する推奨事項を参照してください。