モデルをテストする際は、モデルのトレーニングに使用したものとは異なるサンプルセットを使用する必要があります。後で学習するように、同じサンプルセットでテストするよりも、異なるサンプルでテストする方が、モデルの適合性を示す強力な証拠になります。これらのさまざまな例はどこで入手できますか?従来の ML では、元のデータセットを分割することで、さまざまなサンプルを取得します。したがって、元のデータセットを次の 2 つのサブセットに分割する必要があると考えられます。
[null,null,["最終更新日 2024-11-14 UTC。"],[[["Machine learning models should be tested against a separate dataset, called the test set, to ensure accurate predictions on unseen data."],["It's recommended to split the dataset into three subsets: training, validation, and test sets, with the validation set used for initial testing during training and the test set used for final evaluation."],["The validation and test sets can \"wear out\" with repeated use, requiring fresh data to maintain reliable evaluation results."],["A good test set is statistically significant, representative of the dataset and real-world data, and contains no duplicates from the training set."],["It's crucial to address discrepancies between the dataset used for training and testing and the real-world data the model will encounter to achieve satisfactory real-world performance."]]],[]]