PyCaret в машинном обучении

PyCaret – это библиотека машинного обучения с открытым исходным кодом, которая помогает автоматизировать весь процесс обучения модели машинного обучения. PyCaret – отличный инструмент, который можно использовать в машинном обучении, от выбора модели до обучения и тестирования. В этой статье я познакомлю вас с PyCaret в машинном обучении с его реализацией с помощью Python.

PyCaret

PyCaret – это библиотека машинного обучения с открытым исходным кодом, которая автоматизирует весь процесс обучения модели машинного обучения. При ее использовании вам просто нужно иметь представление о лучших функциях, необходимых для обучения вашей модели машинного обучения, после чего вы сможете использовать PyCaret в разных задачах от выбора модели до обучения и тестирования. Проще говоря, она автоматизирует весь процесс машинного обучения, от выбора модели до обучения и тестирования вашей модели.

Лучшая особенность PyCaret заключается в том, что она помогает вам узнать, какая модель машинного обучения является лучшей, и какую вы должны использовать для определенного набора данных. Она просто показывает вам самые эффективные модели, ранжируя модели на основе показателей измерения производительности моделей машинного обучения. Лучшее в этой функции то, что она делает все с помощью нескольких строк кода.

Поэтому, даже если вам не нравится использовать ярлыки при обучении модели машинного обучения, вы все равно можете использовать их, чтобы выбрать, какая модель лучше всего подойдет для вашего набора данных. Если вы никогда не использовали ее раньше, вы можете легко установить ее с помощью команды pip; pip install pycaret. В следующем разделе я представлю вам руководство по машинному обучению PyCaret с использованием Python.

PyCaret с использованием Python

Надеюсь, теперь вы поняли, что такое PyCaret и почему она используется в машинном обучении. Теперь давайте посмотрим, как реализовать ее с помощью Python для автоматизации выбора модели и обучения модели. Для этой задачи я буду использовать знаменитый набор данных Titanic, чтобы предсказать выживание Титаника с помощью PyCaret и языка программирования Python. Итак, начнем с импорта набора данных:

Набор данных

 import numpy as np
 import pandas as pd
 data = pd.read_csv("train.csv")
 data.head()

Теперь давайте настроим модель. Поскольку это задача классификации, я создам модель для классификации. При настройке этой модели нам нужно объявить данные и целевые метки. Нам также необходимо объявить функции, которые нужно будет игнорировать при обучении модели. Ниже описано, как настроить модель PyCaret для классификации:

 from pycaret.classification import *
 clf = setup(data, target = "Survived",
             ignore_features=["Ticket", "Name", "PassengerId"],
             silent = True, session_id = 786)

Теперь я собираюсь использовать самую важную функцию этой библиотеки, которая сравнивает модели. В машинном обучении она называется выбором модели. Если вы плохо разбираетесь в выборе модели, вы можете использовать эту функцию для выбора модели. Вот как сравнить модели машинного обучения с помощью PyCaret:

 compare_models()

Итак, согласно вышеприведенному выводу, модель Light Gradient Boosting – лучшая модель, которую можно использовать в наборе данных Titanic. Итак, давайте инициализируем модель LightGBM и сделаем прогнозы на тестовом наборе:

 lightgbm = create_model('lightgbm')
 test_data = pd.read_csv('test.csv')
 predict = predict_model(lightgbm, data=test_data)
 predict.head()

Резюме

PyCaret – отличная библиотека машинного обучения для автоматизации всего процесса обучения модели машинного обучения, поскольку она помогает вам начиная от выбора модели и до обучения и тестирования. Вы можете использовать ее хотя бы для выбора модели, если вам не нравятся ярлыки при обучении моделей машинного обучения.

Надеюсь, вам понравилась эта статья о машинном обучении на PyCaret с использованием языка программирования Python.