Матрица неточностей в машинном обучении
Введение в матрицу неточностей в машинном обучении
Матрица неточностей – это массив, используемый для описания производительности модели классификации в машинном обучении. Она также известна как матрица ошибок. В этой статье я расскажу вам о матрице неточностей в машинном обучении.
Что такое матрица неточностей в машинном обучении?
Это – метод оценки эффективности модели классификации. Идея состоит в том, чтобы подсчитать, сколько раз экземпляры класса 1 классифицируются как класс 2. Например, чтобы узнать, сколько раз модель классификации путала изображения собаки с кошкой, вы используете матрицу неточностей.
Чтобы вычислить матрицу неточностей для данной модели классификации, у вас должен быть набор прогнозируемых значений, чтобы их можно было сравнить с набором фактических значений. Вы можете использовать его как на тестовых, так и на тренировочных наборах.
Давайте разберемся с этим на примере
В матрице неточностей каждая строка представляет фактический класс, а каждый столбец представляет прогнозируемый класс. Давайте сформулируем задачу, чтобы лучше понять концепцию.
Например, мы обучили модель машинного обучения отличать изображения собак от изображений других животных. Теперь, после использования матрицы неточностей для прогнозируемых значений, мы получили результат, как показано в таблице ниже:
53057 |
1522 |
1325 |
4096 |
Итак, согласно приведенной выше таблице, первая строка представляет изображения, не относящиеся к собакам, которые относятся только к отрицательному классу, где 53057 из этих значений правильно классифицируются как изображения, не относящиеся к собакам, эти значения известны как истинно отрицательные в машинном обучении. Остальные 1522 значения в первой строке неправильно классифицируются как изображения собак, и эти значения называются ложно положительными в машинном обучении.
Теперь снова посмотрите на таблицу выше, вторая строка таблицы представляет значения изображений собаки, которые являются положительным классом в соответствии с постановкой задачи. Здесь 1325 – это количество раз, когда изображения собак классифицируются как изображения, не относящиеся к собакам, которые в машинном обучении называются ложно отрицательными, а остальные 4096 – это количество раз, когда модель предсказывала их истинность как изображения собаки, и эти значения известны как истинно положительные стороны машинного обучения.
Идеальная модель классификации будет иметь только истинно положительные и истинно отрицательные значения, и это означает, что если матрица неточностей не будет иметь нулевых значений на ее основных диагоналях, модель классификации будет идеальной, как показано ниже.
54579 |
0 |
0 |
5421 |
Надеюсь, вам понравилась эта статья о том, что такое матрица неточностей и ее концепция.