機械学習モデル実験

プラン: Free、Premium、Ultimate
提供形態: GitLab.com、GitLab Self-Managed、GitLab Dedicated

MLモデルを作成する際、モデルのパフォーマンスを向上させるために、さまざまなパラメータ、設定、および機能エンジニアリングを実験する可能性があります。後で実験をレプリケートするには、メタデータとアーティファクトを効果的に追跡する必要があります。GitLabのモデル実験を使用して、パラメータ、メトリクス、およびアーティファクトをGitLabに直接追跡して記録します。

実験とは何ですか？

プロジェクトにおいて、実験とは、比較可能なモデル実行の集合です。実験は長期的なもの（例えば、ユースケースを表す場合）にも、短期的なもの（マージリクエストによってトリガーされるハイパーパラメータチューニングの結果）にもなり得ますが、通常は同じメトリクスで測定された同様のパラメータセットを持つモデル実行を保持します。

モデル実行

モデル実行は、MLモデルのトレーニングのバリエーションであり、最終的にモデルのバージョンにプロモートできます。

データサイエンティストの目標は、与えられたメトリクスによって示されるように、最も優れたモデルパフォーマンスにつながるパラメータ値を持つモデル実行を見つけることです。

パラメータの例をいくつか示します:

アルゴリズム（線形回帰や決定木など）。
アルゴリズムのハイパーパラメータ（学習率、ツリーの深さ、エポック数）。
含まれる機能。

新しい実験と実行を追跡する

実験とトライアルは、MLflowクライアントの互換性を通じてのみ追跡することができます。GitLabをMLflowクライアントのバックエンドとして使用する方法の詳細については、MLflowクライアントの互換性を参照してください。

モデル実行を探索する

現在の有効な実験をリスト表示するには、https/-/ml/experimentsにアクセスするか、次の手順を実行します:

上部のバーで、検索または移動先を選択して、プロジェクトを見つけます。
分析 > モデル検証を選択します。
記録されたすべての実行を、そのメトリクス、パラメータ、およびメタデータとともに表示するには、実験を選択します。
実行の詳細を表示するには、詳細を選択します。

ログアーティファクトを表示する

トライアルアーティファクトは、パッケージとして保存されます。実行にアーティファクトが記録されると、その実行のために記録されたすべてのアーティファクトがパッケージレジストリにリストされます。実行のパッケージ名はml_experiment_<experiment_id>で、バージョンは実行IIDです。アーティファクトへのリンクは、Experiment RunsリストまたはRun detailからもアクセスできます。

CI情報を表示する

実行を作成したCIジョブに関連付けることで、マージリクエスト、パイプライン、パイプラインをトリガーしたユーザーへのクイックリンクを利用できます:

記録されたメトリクスを表示する

実験を実行すると、GitLabは、そのメトリクス、パラメータ、メタデータを含む特定の関連データを記録します。メトリクスは分析用のチャートで表示できます。

記録されたメトリクスを表示するには:

上部のバーで、検索または移動先を選択して、プロジェクトを見つけます。
分析 > モデル検証を選択します。
表示したい実験を選択します。
パフォーマンスタブを選択します。