Python sklearn实现K-means鸢尾花聚类

Python sklearn实现K-means鸢尾花聚类准备1.导入相关包2.直接从sklearn.datasets中加载数据集3.绘制二维数据分布图4.实例化K-means类,并且定义训练函数5.训练6.可视化展示7.预览图准备 使用到的库: numpymatplotlibsklearn 安装: pip instal…

已解决:stability_selection模块报错got an unexpected keyword argument ‘normalize‘等问题

1.stability_selection模块问题 (1) 多余参数 got an unexpected keyword argument ‘normalize‘ got an unexpected keyword argument ‘penalty’(2)导库问题 (3)函数不收敛/数据标准化问题 (4)项目自带的示例跑不通问题 2.stability_selection模块问题解决 【问…

机器学习(十八):Bagging和随机森林

全文共10000余字,预计阅读时间约30~40分钟 | 满满干货(附数据及代码),建议收藏! 本文目标:理解什么是集成学习,明确Bagging算法的过程,熟悉随机森林算法的原理及其在Sklearn中的各参数定义和使用方法 代码…

一元线性回归实现

文章目录1.手工梯度下降法2.sklearn实现1.手工梯度下降法 import numpy as np import matplotlib.pyplot as plt %matplotlib inline#载入数据 datanp.genfromtxt("/root/jupyter_projects/data/fangjia1.csv",delimiter,) #x_datadata[0:,0]#分离data数据&#xff…

极简sklearn-使用决策树预测泰坦尼克号幸存者

泰坦尼克号幸存者数据集是kaggle竞赛中入门级的数据集,今天我们就来用决策树来预测下哪些人会成为幸存者。 数据集下载地址: https://download.csdn.net/download/ting4937/87630361 数据集中包含两个csv文件,data为训练用数据,test为测试集。 探索数据…

十大经典机器学习算法——决策树

目录 一.什么是决策树 二.构造决策树 三.优缺点 一.什么是决策树 一种最基本的分类与回归方法,因为实际应用中基本上全是用来分类,所以重点讨论分类决策树。其本质就是一颗树,根据损失函数最小化原则选择根节点,节点决定分类的走向哪个叶…

机器学习的一些基本知识点

一、什么是机器学习 机器学习是一门能够发觉数据价值的算法与应用,通过自学习算法的开发,从数据中获取知识, 进而实现对未知事件的预测.它提供了一种从数据中获取知识的方法,同时能够逐步提高预测模型的性能,并将模型应用于基于数据驱动的决策中去. 机器学习的三种不同的方法: …

机器学习之集成学习与sklearn使用

一、个体与集成 集成学习(ensemble learning)通过构建并结合多个学习器来完成学习任务,集成学习的一般结构:先产生一组“个体学习器”,再用某种策略将它们结合起来。 sklearn中文;sklearn英文. 目的:把多个…

逻辑回归以及sklearn.linear_model.LogisticRegression的使用

一、逻辑回归 1、基本概念 (1)分类算法:通过对训练样本进行学习,得到从样本特征到标签之间的映射关系,也就是假设函数,然后通过该假设函数对新数据进行分类。    (2)广义线性模型…

sklearn之Model selection and evaluation学习使用

这部分可以结合机器学习之模型评估与选择来阅读,sklearn库的中文地址和英文地址。    总共可以分为5部分:交叉验证来评估学习器性能;调整学习器的超参数;模型评估量化预测的质量。模型持久化。验证曲线,绘制分数来评…

连续属性离散化与sklearn.preprocessing.KBinsDiscretizer

1、连续属性离散化 离散化 (Discretization) (有些时候叫 量化(quantization) 或 分箱(binning)) ,是将连续特征划分为离散特征值的方法。 离散化可以把具有连续属性的数据集变换成只有名义属性(nominal attributes)的数据集。 2、K-bins 离散化(分箱&a…

CART决策树以及sklearn.tree.DecisionTreeClassifier()使用

一、CART树分类 1、CART分类树的构建 利用基尼指数作为划分标准,通过样本中的特征,对样本进行划分,直到所有叶结点中的所有样本都是同一类为止,构建过程如下:    (1)遍历属性和该属性可能的切…

机器学习之降维(特征选择与特征提取)

一、降维技术主要分为两大类:特征选择和特征提取。 基本概念:特征选择:我们可以选出原始特征的一个子集。特征提取:通过现有信息进行推演,构造出一个新的特征子空间。 为什么要降维:    (1&a…

SVM支持向量机与sklearn支持向量机分类

一、SVM的基本概念 1、总览: 在之前的机器学习基本知识中,总结了支持向量机的相关基础概念。    支持向量机(Support Vector Machine, SVM)是定义在特征空间上间隔最大的线性分类器。它是一种二分类模型,当采用核技巧之后&…

基于逻辑回归的入侵检测

1、简介 基于KDDCUP99数据集,利用逻辑回归方法进行入侵检测学习。 2、主要步骤 第一步,数据预处理:对KDDCUP99原始数据集进行处理,使其成为适合进行学习的形式。进行特征选择,降低维度。 第二步,调参&am…

【xgboost】XGBoost 调参

1. 原生api 训练、网格搜索1.1 数据1.2 设置参数 & 训练1.3 网格搜索调参1.3.1 外套sklearn api⭐⭐⭐1.3.2 自定义目标函数1.3.3 设置搜索参数 & 初次搜索1.3.4 确定部分参数 & 进一步搜索 1.4 循环、交叉验证调参 2. sklearn api 调参2.1 数据2.2 网格搜索2.3 op…