LazyPredict дает представление о том, какую модель мл следует использовать для набора данных. В некоторых наборах данных так сложно решить, какая модель мл работает хорошо, а LazyPredict дает такое четкое представление. LazyPredict — это библиотека с открытым исходным кодом, очень популярная среди специалистов по данным. Дизайн LazyPredict использует разные библиотеки мл друг с другом и оценивает частоту ошибок модели мл. LazyPredict использует от самой популярной модели мл до самой неизвестной модели. Существует два типа групп. Один из них классификация, а другой - регрессия. Я приведу примеры, что два типа группы. Я прошёл каждый процесс для готовой к использованию библиотеки мл. Я хочу показать пример кода LazyPredict. Пример первой классификации. Я использую https://www.kaggle.com/datasets/ppb00x/credit-risk-customers эти данные для ленивого классификатора.
clf=LazyClassifier()
modeller, tahmin=clf.fit(X_train, X_test, y_train, y_test)
print(modeller)
100%|██████████| 29/29 [00:02<00:00, 12.77it/s]
Accuracy Balanced Accuracy ROC AUC F1 Score \
Model
XGBClassifier 0.83 0.77 0.77 0.83
LGBMClassifier 0.81 0.74 0.74 0.81
RandomForestClassifier 0.80 0.71 0.71 0.78
QuadraticDiscriminantAnalysis 0.76 0.70 0.70 0.75
GaussianNB 0.73 0.70 0.70 0.74
ExtraTreesClassifier 0.79 0.69 0.69 0.77
AdaBoostClassifier 0.76 0.67 0.67 0.74
NuSVC 0.76 0.67 0.67 0.75
BernoulliNB 0.74 0.67 0.67 0.74
KNeighborsClassifier 0.74 0.65 0.65 0.73
DecisionTreeClassifier 0.70 0.65 0.65 0.70
NearestCentroid 0.65 0.65 0.65 0.66
BaggingClassifier 0.69 0.64 0.64 0.69
LabelPropagation 0.69 0.63 0.63 0.69
LabelSpreading 0.69 0.63 0.63 0.69
LinearDiscriminantAnalysis 0.74 0.63 0.63 0.72
SVC 0.76 0.63 0.63 0.72
ExtraTreeClassifier 0.66 0.63 0.63 0.67
LogisticRegression 0.73 0.62 0.62 0.71
Perceptron 0.68 0.61 0.61 0.68
LinearSVC 0.72 0.60 0.60 0.70
RidgeClassifier 0.72 0.60 0.60 0.69
CalibratedClassifierCV 0.73 0.59 0.59 0.69
RidgeClassifierCV 0.72 0.59 0.59 0.69
SGDClassifier 0.69 0.58 0.58 0.67
PassiveAggressiveClassifier 0.66 0.57 0.57 0.65
DummyClassifier 0.70 0.50 0.50 0.58
Time Taken
Model
XGBClassifier 1.32
LGBMClassifier 0.07
RandomForestClassifier 0.12
QuadraticDiscriminantAnalysis 0.01
GaussianNB 0.01
ExtraTreesClassifier 0.11
AdaBoostClassifier 0.07
NuSVC 0.05
BernoulliNB 0.01
KNeighborsClassifier 0.02
DecisionTreeClassifier 0.01
NearestCentroid 0.01
BaggingClassifier 0.03
LabelPropagation 0.04
LabelSpreading 0.04
LinearDiscriminantAnalysis 0.03
SVC 0.04
ExtraTreeClassifier 0.01
LogisticRegression 0.01
Perceptron 0.01
LinearSVC 0.05
RidgeClassifier 0.02
CalibratedClassifierCV 0.14
RidgeClassifierCV 0.01
SGDClassifier 0.01
PassiveAggressiveClassifier 0.01
DummyClassifier 0.01
Этот пример является примером регрессии. Я использую https://www.kaggle.com/datasets/sanjeetsinghnaik/most-expensive-footballers-2021 эти данные для ленивого регрессора.
from lazypredict.Supervised import LazyRegressor
reg = LazyRegressor(verbose=0,ignore_warnings=False, custom_metric=None )
reg.fit(X_train, X_test, y_train, y_test)
( Adjusted R-Squared R-Squared RMSE Time Taken
Model
BayesianRidge -0.04 0.03 20.17 0.00
ElasticNetCV -0.04 0.02 20.19 0.03
LassoLarsIC -0.04 0.02 20.20 0.02
LassoCV -0.04 0.02 20.21 0.04
RidgeCV -0.04 0.02 20.21 0.01
LarsCV -0.04 0.02 20.21 0.01
LassoLarsCV -0.04 0.02 20.21 0.00
Ridge -0.04 0.02 20.23 0.01
TransformedTargetRegressor -0.04 0.02 20.23 0.00
LinearRegression -0.04 0.02 20.23 0.01
Lars -0.04 0.02 20.23 0.02
SGDRegressor -0.04 0.02 20.24 0.01
ElasticNet -0.05 0.02 20.26 0.00
TweedieRegressor -0.05 0.02 20.26 0.02
Lasso -0.05 0.01 20.30 0.00
GammaRegressor -0.05 0.01 20.33 0.02
PoissonRegressor -0.06 0.00 20.41 0.00
OrthogonalMatchingPursuitCV -0.08 -0.01 20.58 0.00
OrthogonalMatchingPursuit -0.08 -0.01 20.58 0.02
DummyRegressor -0.10 -0.03 20.79 0.02
LassoLars -0.10 -0.03 20.79 0.00
LGBMRegressor -0.11 -0.04 20.85 0.03
HistGradientBoostingRegressor -0.11 -0.04 20.85 0.19
AdaBoostRegressor -0.12 -0.05 20.94 0.03
BaggingRegressor -0.13 -0.06 21.05 0.02
NuSVR -0.14 -0.07 21.16 0.00
RandomForestRegressor -0.14 -0.07 21.19 0.12
HuberRegressor -0.15 -0.08 21.24 0.00
GradientBoostingRegressor -0.16 -0.09 21.30 0.02
KNeighborsRegressor -0.17 -0.10 21.41 0.02
ExtraTreesRegressor -0.20 -0.13 21.69 0.09
XGBRegressor -0.23 -0.15 21.96 0.05
SVR -0.23 -0.16 21.97 0.00
PassiveAggressiveRegressor -0.24 -0.17 22.07 0.01
LinearSVR -0.25 -0.17 22.13 0.00
QuantileRegressor -0.27 -0.19 22.28 0.31
MLPRegressor -0.29 -0.21 22.46 0.20
RANSACRegressor -0.30 -0.22 22.60 0.03
GaussianProcessRegressor -0.75 -0.65 26.24 0.01
ExtraTreeRegressor -0.84 -0.73 26.87 0.00
DecisionTreeRegressor -0.92 -0.80 27.46 0.00
KernelRidge -2.97 -2.73 39.47 0.00,
Adjusted R-Squared R-Squared RMSE Time Taken
Model
BayesianRidge -0.04 0.03 20.17 0.00
ElasticNetCV -0.04 0.02 20.19 0.03
LassoLarsIC -0.04 0.02 20.20 0.02
LassoCV -0.04 0.02 20.21 0.04
RidgeCV -0.04 0.02 20.21 0.01
LarsCV -0.04 0.02 20.21 0.01
LassoLarsCV -0.04 0.02 20.21 0.00
Ridge -0.04 0.02 20.23 0.01
TransformedTargetRegressor -0.04 0.02 20.23 0.00
LinearRegression -0.04 0.02 20.23 0.01
Lars -0.04 0.02 20.23 0.02
SGDRegressor -0.04 0.02 20.24 0.01
ElasticNet -0.05 0.02 20.26 0.00
TweedieRegressor -0.05 0.02 20.26 0.02
Lasso -0.05 0.01 20.30 0.00
GammaRegressor -0.05 0.01 20.33 0.02
PoissonRegressor -0.06 0.00 20.41 0.00
OrthogonalMatchingPursuitCV -0.08 -0.01 20.58 0.00
OrthogonalMatchingPursuit -0.08 -0.01 20.58 0.02
DummyRegressor -0.10 -0.03 20.79 0.02
LassoLars -0.10 -0.03 20.79 0.00
LGBMRegressor -0.11 -0.04 20.85 0.03
HistGradientBoostingRegressor -0.11 -0.04 20.85 0.19
AdaBoostRegressor -0.12 -0.05 20.94 0.03
BaggingRegressor -0.13 -0.06 21.05 0.02
NuSVR -0.14 -0.07 21.16 0.00
RandomForestRegressor -0.14 -0.07 21.19 0.12
HuberRegressor -0.15 -0.08 21.24 0.00
GradientBoostingRegressor -0.16 -0.09 21.30 0.02
KNeighborsRegressor -0.17 -0.10 21.41 0.02
ExtraTreesRegressor -0.20 -0.13 21.69 0.09
XGBRegressor -0.23 -0.15 21.96 0.05
SVR -0.23 -0.16 21.97 0.00
PassiveAggressiveRegressor -0.24 -0.17 22.07 0.01
LinearSVR -0.25 -0.17 22.13 0.00
QuantileRegressor -0.27 -0.19 22.28 0.31
MLPRegressor -0.29 -0.21 22.46 0.20
RANSACRegressor -0.30 -0.22 22.60 0.03
GaussianProcessRegressor -0.75 -0.65 26.24 0.01
ExtraTreeRegressor -0.84 -0.73 26.87 0.00
DecisionTreeRegressor -0.92 -0.80 27.46 0.00
KernelRidge -2.97 -2.73 39.47 0.00)
То есть о ленивых предсказаниях. Я надеюсь, что понимаю очень хорошо.