• 人工智能教程(二)


            本文用一个机器学习的实例,让大家看一下其实机器学习没有那么难学,希望大家看后可以增加自信,坚持把人工智能的知识学好。

            本实例的数据集来自kaggle网站,用来预测泰坦尼克号沉船事件的幸存者。采用的模型是xgboost。  该问题属于监督学习中的二分类问题

    1. import xgboost as xgb
    2. from xgboost.sklearn import XGBClassifier
    3. train_data = pd.read_csv("/kaggle/input/titanic/train.csv") # 导入训练数据
    4. train_data.head()
    5. test_data = pd.read_csv("/kaggle/input/titanic/test.csv") # 导入测试数据
    6. test_data.head()
    7. y = train_data["Survived"] # 获取训练标签
    8. features = ["Pclass", "Sex", "SibSp", "Parch"]
    9. X = pd.get_dummies(train_data[features]) # 获取训练特征
    10. X_test = pd.get_dummies(test_data[features]) #获取测试特征
    11. xlf = xgb.XGBClassifier(max_depth=3, #树的深度,越大越容易过拟合
    12. learning_rate=0.1,
    13. n_estimators=1000,
    14. objective='binary:logistic',
    15. nthread=8,
    16. gamma=0,
    17. min_child_weight=1,
    18. max_delta_step=0,
    19. subsample=0.7,
    20. colsample_bytree=0.7,
    21. colsample_bylevel=1,
    22. reg_alpha=1, #控制模型复杂程度的权重值的 L1 正则项参数,参数值越大,模型越不容易过拟合
    23. reg_lambda=1, # 控制模型复杂度的权重值的L2正则化项参数,参数越大,模型越不容易过拟合。
    24. scale_pos_weight=1,
    25. seed=50)
    26. predictions=xlf.predict(X_test) # 模型预测
    27. output = pd.DataFrame({'PassengerId': test_data.PassengerId, 'Survived': predictions})

            代码的关键部分都加了注释,如果实在看不到也没有关系, 这个例子只是让大家感受一下其实机器学习没有那么难学。后续我们会一步一步的学习相关的知识,大家不能着急。

  • 相关阅读:
    计算机毕业设计springboot+vue基本安卓/微信小程序的驾校考试预约系统 uniapp
    twitter推文案例
    泰山OFFICE技术讲座:由行的布局高度,谈绘制高度的高度溢出、高度缩水(全网首发)
    idea技巧--debug使用技巧
    《洛谷深入浅出基础篇》——P3405 citis and state ——哈希表
    非递归中序遍历二叉树
    uniapp: 实现pdf预览功能
    Spring-AOP-加强
    golang反射
    python之文件操作
  • 原文地址:https://blog.csdn.net/yongche_shi/article/details/126764531