数据简介该数据集最初来自糖尿病/消化/肾脏疾病研究所,此数据集的目标是基于数据集中包含的某些身体指标来诊断性的预测患者是否患有糖尿病。数据集由多个医学指标和一个目标变量Outcome组成,医学指标包含患者的怀孕次数、BMI指数、胰岛素水平、年龄、血压等。代码导入基础依赖1234importpandasaspdimportnumpyasnpimportmatplotlib.pyplotaspltimportseabornassns导入数据查看基础信息12345pima = pd.read_csv("diabetes.csv")# pima.head()# pima.info()# pima.shapepima.describe()数据可视化123456789101112131415# 柱状图pima.hist(figsize=(16,14))# 散点图sns.pairplot(pima, hue="Outcome")# 箱图pima.plot(kind="box", subplots=True, layout=(3,3), sharex=False, sharey=False, figsize=(16,14))# 热点图column_x = pima.columns[0:len(pima.columns)-1]column_xcorr = pima[pima.co
...
继续阅读
(93)