正式なドキュメントは英語版であり、この日本語訳はAI支援翻訳により作成された参考用のものです。日本語訳の一部の内容は人間によるレビューがまだ行われていないため、翻訳のタイミングにより英語版との間に差異が生じることがあります。最新かつ正確な情報については、英語版をご参照ください。

機械学習モデル実験

  • プラン: Free、Premium、Ultimate
  • 提供形態: GitLab.com、GitLab Self-Managed、GitLab Dedicated

MLモデルを作成する際、モデルのパフォーマンスを向上させるために、さまざまなパラメータ、設定、および機能エンジニアリングを実験する可能性があります。後で実験をレプリケートするには、メタデータとアーティファクトを効果的に追跡する必要があります。GitLabのモデル実験を使用して、パラメータ、メトリクス、およびアーティファクトをGitLabに直接追跡して記録します。

実験とは何ですか?

プロジェクトにおいて、実験とは、比較可能なモデル実行の集合です。実験は長期的なもの(例えば、ユースケースを表す場合)にも、短期的なもの(マージリクエストによってトリガーされるハイパーパラメータチューニングの結果)にもなり得ますが、通常は同じメトリクスで測定された同様のパラメータセットを持つモデル実行を保持します。

モデルと実行数、作成者、最終アクティビティを示すモデル実験テーブル。

モデル実行

モデル実行は、MLモデルのトレーニングのバリエーションであり、最終的にモデルのバージョンにプロモートできます。

実行ID、作成タイムスタンプ、作成者名、およびステータスを含む実験実行リストテーブル。

データサイエンティストの目標は、与えられたメトリクスによって示されるように、最も優れたモデルパフォーマンスにつながるパラメータ値を持つモデル実行を見つけることです。

MLflow実行ID、ソース情報、パラメータを表示する実験の詳細とメタデータページ。

パラメータの例をいくつか示します:

  • アルゴリズム(線形回帰や決定木など)。
  • アルゴリズムのハイパーパラメータ(学習率、ツリーの深さ、エポック数)。
  • 含まれる機能。

新しい実験と実行を追跡する

実験とトライアルは、MLflowクライアントの互換性を通じてのみ追跡することができます。GitLabをMLflowクライアントのバックエンドとして使用する方法の詳細については、MLflowクライアントの互換性を参照してください。

モデル実行を探索する

現在の有効な実験をリスト表示するには、https/-/ml/experimentsにアクセスするか、次の手順を実行します:

  1. 上部のバーで、検索または移動先を選択して、プロジェクトを見つけます。
  2. 分析 > モデル検証を選択します。
  3. 記録されたすべての実行を、そのメトリクス、パラメータ、およびメタデータとともに表示するには、実験を選択します。
  4. 実行の詳細を表示するには、詳細を選択します。

ログアーティファクトを表示する

トライアルアーティファクトは、パッケージとして保存されます。実行にアーティファクトが記録されると、その実行のために記録されたすべてのアーティファクトがパッケージレジストリにリストされます。実行のパッケージ名はml_experiment_<experiment_id>で、バージョンは実行IIDです。アーティファクトへのリンクは、Experiment RunsリストまたはRun detailからもアクセスできます。

CI情報を表示する

実行を作成したCIジョブに関連付けることで、マージリクエスト、パイプライン、パイプラインをトリガーしたユーザーへのクイックリンクを利用できます:

関連付けられたCIジョブ、パイプライン、およびユーザー情報を表示する実行詳細ページ。

記録されたメトリクスを表示する

実験を実行すると、GitLabは、そのメトリクス、パラメータ、メタデータを含む特定の関連データを記録します。メトリクスは分析用のチャートで表示できます。

記録されたメトリクスを表示するには:

  1. 上部のバーで、検索または移動先を選択して、プロジェクトを見つけます。
  2. 分析 > モデル検証を選択します。
  3. 表示したい実験を選択します。
  4. パフォーマンスタブを選択します。

実験のパフォーマンスを示すグラフ