糖尿病遗传风险检测挑战赛Baseline

发布时间:2023-10-27 14:30

本次比赛是一个数据挖掘赛,需要选手通过训练集数据构建模型,然后对验证集数据进行预测,预测结果进行提交。
本题的任务是构建一种模型,该模型能够根据患者的测试数据来预测这个患者是否患有糖尿病。这种类型的任务是典型的二分类问题(患有糖尿病 / 不患有糖尿病),模型的预测输出为 0 或 1 (患有糖尿病:1,未患有糖尿病:0)

赛事链接:https://challenge.xfyun.cn/topic/info?type=diabetes&option=tjjg

这次竞赛是来自DataWhale的一份数据挖掘相关的竞赛教程:
https://xj15uxcopw.feishu.cn/docx/doxcn5bbI3eupMF95XW5Y5ZM6jd

DataWhale提供了LightGBM预测的Baseline,我自己也写了一个神经网络的Baseline,虽然效果远不如LightBGM好,希望大家能在此基础上继续优化。

下载后的数据集如下所示,我将他们重命名为英文:
糖尿病遗传风险检测挑战赛Baseline_第1张图片

  • submit.csv: 提交结果的样例
  • test.csv: 测试集数据
  • train.csv: 训练集数据

ItVuer - 免责声明 - 关于我们 - 联系我们

本网站信息来源于互联网,如有侵权请联系:561261067@qq.com

桂ICP备16001015号