XGBoost的简单安装及入门使用

XGBoost安装及简单入门

XGBoost支持多种操作系统,如Windows, Linux, MacOS等,并支持多种语言版本,如Python, R, Scale, Java等。XGBoost的安装方式一般有两种,一种是直接通过pip安装(适合用于Python),另外一种是通过源码编译安装
1、通过pip安装
通过pip安装Python包既简单又方便,只需执行如下的命令:

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple xgboost

使用清华的镜像来进行下载,可以快速安装,在安装完成后,可以在Python中直接引用XGBoost包,代码如下:

XGBoost的简单安装及入门使用
import xgboost as xgb

通过pip安装的是PyPI(Python Package Index)中已经预编译好的XGBoost包,目前提供了Linux 64位和Windows 64位两种。

2、通过源码编译安装
虽然通过pip安装XGBoost比较方便,但是这种方法只适用于Python环境下,并且其安装的XGBoost版本可能不是最新的版本。如果我们想要在其他语言环境下或者想要安装最新的XGBoost版本,则可直接通过编译源码安装。源码编译安装XGBoost主要分为两个步骤
(1)通过C++代码构建共享库(Linux/OSX中为libxgboost.so, Windows中为xgboost.dll)
(2)安装相应的语言包

XGBoost的初使用:
在这里我们使用一个经典的数据集来训练XGBoost,鸢尾花数据集,在训练集上进行测试,并在测试集上测试得到在测试集上的准确率

其简单的代码如下所示:

import xgboost as xgb
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split

iris = load_iris()
X,y = iris.data,iris.target
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=1234565)
from sklearn.metrics import accuracy_score

params = {
    'booster': 'gbtree',
    'objective': 'multi:softmax',
    'num_class': 3,
    'gamma': 0.1,
    'max_depth': 6,
    'lambda': 2,
    'subsample': 0.7,
    'colsample_bytree': 0.75,
    'min_child_weight': 3,
    'silent': 0,
    'eta': 0.1,
    'seed': 1,
    'nthread': 4,
}

dtrain = xgb.DMatrix(X_train, y_train)

num_round = 5

model = xgb.train(params, dtrain, num_round)
dtest = xgb.DMatrix(X_test)
y_pred = model.predict(dtest)

accuracy = accuracy_score(y_test,y_pred)
print("accuarcy: %.2f%%" % (accuracy*100.0))

在测试集上,可以得到96.67%的准确率

XGBoost的简单安装及入门使用

Original: https://blog.csdn.net/qq_41513230/article/details/124856599
Author: 抹不掉的过去666
Title: XGBoost的简单安装及入门使用

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/606182/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

  • 【通信原理】通信系统概念、组成、分类、度量的分析与研究

    🚀个人主页:欢迎访问Ali.s的首页 ⏰ 最近更新:2022年8月15日 ⛽ Java框架学习系列:【Spring】【SpringMVC】【Mybatis】 🔥 Java项目实战系…

    人工智能 2023年7月3日
    072
  • anaconda中pytorch安装(GPU)(踩坑+填坑)

    目录 电脑硬件与软件环境 * 硬件 软件版本 简要说明 – 查看版本 激活环境 开始正式安装 * 填第一个坑 anaconda换源 – 方法一 方法二 填第…

    人工智能 2023年7月24日
    059
  • html好看的生日祝福,生日表白(源码)

    文章目录 1.设计来源 * 1.1 主界面 1.2 秘密基地 1.3 甜言蜜语 2.效果和源码 * 2.1 动态效果 2.2 源代码 2.3 自定义背景图片代码 2.4 自定义每次…

    人工智能 2023年7月31日
    0107
  • Conda配置清华源加速安装Python包(2021.11最新版)

    本教程适用范围 本教程 适用于64位windows操作系统。其他操作系统可以根据本教程的思路以此类推,探索配置方法。 目前网上给Conda配置清华源的教程很多,但是由于网上信息新老…

    人工智能 2023年5月25日
    0117
  • 【youcans 的 OpenCV 例程200篇】180.基于距离变换的分水岭算法

    OpenCV 例程200篇 总目录-202205更新 【youcans 的 OpenCV 例程200篇】180.基于距离变换的分水岭算法【youcans 的 OpenCV 例程20…

    人工智能 2023年6月21日
    0104
  • 【SQL实战项目】电商平台数据分析项目

    一.分析背景和目的 背景介绍 电商平台数据分析是最为典型的一个数据分析赛道,且电商数据分析有着比较成熟的数据分析模型,比如:人货场模型。此文中我将通过分析国内最大的电商平台——淘宝…

    人工智能 2023年6月19日
    0115
  • Python贪吃蛇 (完整代码+详细注释+粘贴即食)

    文章目录 代码 运行截图 笔记补充 参考博客(阿里嘎多!) 代码 ”’ 游戏玩法:回车开始游戏;空格暂停游戏/继续游戏;方向键/wsad控制小蛇走向 ”’ ”’ 思路:用列表…

    人工智能 2023年7月6日
    0267
  • Java之IO流

    目录: 一、IO流介绍 二、案例 一、IO流介绍 在java中,操作文件(读写)是通过IO流相关的类来实现的。 在java标准库中,对于IO的操作提供了很多现成的类,这些类都放在了…

    人工智能 2023年6月30日
    076
  • 李宏毅2022机器学习HW2解析

    准备工作:去课程github下载原始代码,kaggle下载数据集。或者关注本公众号,下载代码和数据集(文末有方法)。解压数据集,出现libriphone文件夹 ,将文件和代码放到同…

    人工智能 2023年6月25日
    096
  • MINIST手写数字数据集–神经网络(mini-batch)

    1.1 数据集介绍 MNIST 数据集主要由一些手写数字的图片和相应的标签组成,图片一共有10 类,分别对应从0~9 ,共10 个阿拉伯数字。 1.2 思路介绍 导入数据集 对导入…

    人工智能 2023年6月23日
    0102
  • AISHELL-1 语音识别实战

    AISHELL-1 开发者学习语音技术离不开数据, AISHELL-1 数据集自2017年由希尔贝壳发布至今始终被高频应用在语音技术开发及实验中。录音时长 178小时,录音文本涉及…

    人工智能 2023年5月25日
    093
  • 数据分析工具Pandas总结

    一、Pandas的主要的数据结构:Series 和DataFrame 。 1.Series:一种类似于一维数组的对象,是由一组数据(各种NumPy数据类型)以及一组与之相关的数据标…

    人工智能 2023年7月16日
    076
  • jupyter note book ipkernel 安装教程

    这是一个联邦学习教程系列。 笔者在安装CUDA过程中走了很多弯路,实验室服务器又不靠谱,故还是自己电脑上搭载CUDA最方便 一切安装以conda为主,不建议用pip安装 pip添加…

    人工智能 2023年7月22日
    057
  • 1. 梯度下降法

    简介 梯度下降法是一种函数极值的优化算法。在机器学习中,主要用于寻找最小化损失函数的的最优解。是算法更新模型参数的常用的方法之一。 相关概念 1. 导数 定义 设一元函数(f(x)…

    人工智能 2023年6月4日
    087
  • 戴口罩的人脸识别

    上一次写技术文章是去年4月份了,时隔一整年终于又恬不知耻的上线了! 其实这中间有好多事都想要写,找实习,找工作,申博,考试等 但人的惰性太大了,停笔容易,但是想再拾起笔可真是太难了…

    人工智能 2023年7月11日
    076
  • 《Python 快速入门》C站最全Python标准库总结

    本文收录于《100 天精通 Python – 快速入门到黑科技》专栏,是由 CSDN 内容合伙人丨全站排名 Top 4 的硬核博主 不吃西红柿 倾力打造。分基础知识篇、…

    人工智能 2023年6月3日
    090
亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球