DataQuaner
机器学习系列之决策树算法(03):决策树的剪枝 机器学习系列之决策树算法(03):决策树的剪枝
1. 前言上一篇文章介绍了决策树的生成详细过程,由于决策树生成算法过多地考虑如何提高对训练数据的正确分类,从而构建过于复杂的决策树,这样产生的决策树往往对训练数据的分类很准确,却对未知的测试数据的分类没有那么准确,即出现过拟合现象。我们需要
机器学习系列之决策树算法(02):决策树的生成 机器学习系列之决策树算法(02):决策树的生成
1. 前言上文讲到决策树的特征选择会根据不同的算法选择不同的分裂参考指标,例如信息增益、信息增益比和基尼指数,本文完整分析记录决策树的详细生成过程和剪枝处理。 2. 决策树的生成 示例数据表格     文章所使用的数据集如下,来源于《数据分
xgboost算法模型输出的解释 xgboost算法模型输出的解释
1. 问题描述 近来, 在python环境下使用xgboost算法作若干的机器学习任务, 在这个过程中也使用了其内置的函数来可视化树的结果, 但对leaf value的值一知半解; 同时, 也遇到过使用xgboost 内置的predict
LightGBM算法基础系列之基础理论篇(1) LightGBM算法基础系列之基础理论篇(1)
这是lightgbm算法基础系列的第一篇,讲述lightgbm基础理论。 document.querySelectorAll('.github-emoji') .forEach(el => {
机器学习系列之决策树算法(10):决策树模型,XGBoost,LightGBM和CatBoost模型可视化 机器学习系列之决策树算法(10):决策树模型,XGBoost,LightGBM和CatBoost模型可视化
安装 graphviz 参考文档 http://graphviz.readthedocs.io/en/stable/manual.html#installation graphviz安装包下载地址 https://www.graphviz
短文本聚类【DBSCAN】算法原理+Python代码实现+聚类结果展示 短文本聚类【DBSCAN】算法原理+Python代码实现+聚类结果展示
目录[TOC] 1. 算法原理1.1 常见的聚类算法聚类算法属于常见的无监督分类算法,在很多场景下都有应用,如用户聚类,文本聚类等。常见的聚类算法可以分成两类: 以 k-means 为代表的基于分区的算法 以层次聚类为代表的基于层次划分的
DBSCAN算法python实现(附完整数据集和代码) DBSCAN算法python实现(附完整数据集和代码)
目录[TOC] 1. 算法思路DBSCAN算法的核心是“延伸”。先找到一个未访问的点p,若该点是核心点,则创建一个新的簇C,将其邻域中的点放入该簇,并遍历其邻域中的点,若其邻域中有点q为核心点,则将q的邻域内的点也划入簇C,直到C不再扩展。
机器学习系列之决策树算法(08):梯度提升树算法LightGBM 机器学习系列之决策树算法(08):梯度提升树算法LightGBM
1. LightGBM简介GBDT (Gradient Boosting Decision Tree) 是机器学习中一个长盛不衰的模型,其主要思想是利用弱分类器(决策树)迭代训练以得到最优模型,该模型具有训练效果好、不易过拟合等优点。GBD
机器学习系列之决策树算法(07):梯度提升树算法XGBoost实战:原生接口和sklearn接口区别 机器学习系列之决策树算法(07):梯度提升树算法XGBoost实战:原生接口和sklearn接口区别
1 前言2 官方文档英文官方文档 中文文档 3 sklearn接口from xgboost.sklearn import XGBClassifier xgbc = XGBClassifier(n_jobs=-1) # 新建xgboost
机器学习系列之决策树算法(07):梯度提升树算法XGBoost实战 机器学习系列之决策树算法(07):梯度提升树算法XGBoost实战
1 前言上一篇从数据原理角度深入介绍了XGBoost的实现原理及优化,参考《梯度提升树算法XGBoost》。本篇主要介绍XGBoost的工程实战,参数调优等内容。 学习一个算法实战,一般按照以下几步,第一步能够基于某个平台、某种语言构建一
1 / 2