发布时间:2023-10-27 14:30
本次比赛是一个数据挖掘赛,需要选手通过训练集数据构建模型,然后对验证集数据进行预测,预测结果进行提交。
本题的任务是构建一种模型,该模型能够根据患者的测试数据来预测这个患者是否患有糖尿病。这种类型的任务是典型的二分类问题(患有糖尿病 / 不患有糖尿病),模型的预测输出为 0 或 1 (患有糖尿病:1,未患有糖尿病:0)
赛事链接:https://challenge.xfyun.cn/topic/info?type=diabetes&option=tjjg
这次竞赛是来自DataWhale的一份数据挖掘相关的竞赛教程:
https://xj15uxcopw.feishu.cn/docx/doxcn5bbI3eupMF95XW5Y5ZM6jd
DataWhale提供了LightGBM预测的Baseline,我自己也写了一个神经网络的Baseline,虽然效果远不如LightBGM好,希望大家能在此基础上继续优化。