Pycaret详细介绍该库⽤法及案例(分类⽅法案例胎⼉状态分类指南)Pycaret
基本流程⼀般包含:读取数据->建模/对⽐模型->模型预测->绘图分析->模型导出
从PyCaret的存储库加载数据
#从pycaret中加载数据
from pycaret.datasets import get_data
data = get_data('juice')
pycaret的资料存储库
核⼼代码⽅法:
anomaly.py 异常值检测(⽆监督)
arules.py 关联规则(⽆监督)
classification.py 分类(有监督)
clustering.py 聚类(⽆监督)
datasets.py 数据加载(辅助⼯具)
nlp.py ⾃然语⾔处理(⽆监督)
preprocess.py 预处理(辅助⼯具,被其它模块内部调⽤)
regression.py 回归(有监督)
导⼊模块
# Classification
from pycaret.classification import*
# Regression
ssion import*
# Clustering
from pycaret.clustering import*
# Anomaly Detection
from pycaret.anomaly import*
# Natural Language Processing
from pycaret.nlp import*
# Association Rule Mining
from pycaret.arules import*
各个类实例
分类例
# Importing dataset
from pycaret.datasets import get_data
diabetes = get_data('diabetes')
# Importing module and initializing setup
from pycaret.classification import*
clf1 = setup(data = diabetes, target ='Class variable')
回归实例
# Importing dataset
from pycaret.datasets import get_data boston = get_data('boston')
# Importing module and initializing setup ssion import*
reg1 = setup(data = boston, target ='medv')
聚类⽰例
# Importing dataset
from pycaret.datasets import get_data jewellery = get_data('jewellery')
# Importing module and initializing setup from pycaret.clustering import*
clu1 = setup(data = jewellery)
异常检测⽰例
# Importing dataset
from pycaret.datasets import get_data anomalies = get_data('anomaly')
# Importing module and initializing setup from pycaret.anomaly import*
ano1 = setup(data = anomalies)
⾃然语⾔处理⽰例
# Importing dataset
from pycaret.datasets import get_data
kiva = get_data('kiva')
# Importing module and initializing setup
from pycaret.nlp import*
nlp1 = setup(data = kiva, target ='en')
关联规则挖掘⽰例
# Importing dataset
from pycaret.datasets import get_data
isnull的用法france = get_data('france')
# Importing module and initializing setup
from pycaret.arules import*
arules1 = setup(data = france, transaction_id ='InvoiceNo', item_id ='Description')
常⽤的函数⽅法
get_data() 读数据,例程中多为读取⽰例数据,⽤户可以使⽤⾃⼰的数据代替。
setup() 预处理,各种建模⽅法(如分类/聚类)根据⾃⼰的特点实现了不同的setup,其中⼏乎都包含对预处理模块的调⽤。
models() 列出当前建模⽅法⽀持的所有模型。
compare_models() 训练多个模型,并对⽐其效果。
create_model() 训练模型。
predict_model() 使⽤模型预测。
plot_model() 显⽰模型相关的各种分析图,如AUC曲线,学习曲线,还包含词云图等。tune_model() 模型调参。
assign_model() 查看⽆监督模型打标签的情况。
evaluate_model() 评价模型。
deploy_model() 云端部署。
ensemble_model() 集成模型。
finalize_model() 导出最终模型和参数。
案例(分类⽅法案例胎⼉状态分类指南)
from pycaret.datasets import get_data
import pandas as pd
import numpy as np
import warnings
获取数据
from pycaret.datasets import get_data
df= get_data('CTG')
#查看前五⾏
df.head()
## 删除不需要的列名称⽇期等
df=df.drop(["FileName","Date","SegFile","b","e"],axis=1)
#查看列名称
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论