%A 冯欣, 张航 , 辛瑞昊 %T 基于Lasso特征选择乳腺癌二分类算法研究 %0 Journal Article %D 2023 %J 吉林化工学院学报 %R 10.16039/j.cnki.cn22-1249.2023.01.006 %P 23-28 %V 40 %N 1 %U {https://xuebao.jlict.edu.cn/CN/abstract/article_1835.shtml} %8 2023-01-25 %X
近年来,随着大数据挖掘技术在医疗行业的迅速发展,临床精准治疗成为医疗大数据领域的研究热点。基于UCI数据库中乳腺癌数据集,通过构建乳腺癌二分类算法来预测乳腺肿瘤类型。其中针对不平衡数据集的处理、特征选择算法的优化以及分类准确率的评估,使用了机器学习技术包括随机过采样算法、Least absolute shrinkage and selection operator(Lasso)回归进行特征选择、序列前向选择(SFS)的特征选择算法。结果表明包含其中的6个特征的随机森林算法分类准确率最高(97.07%),相对于未进行特征选择算法的准确率有所提高,有可能在乳腺癌检测方面提供新的思路。