基于决策树的DRGs制度研究——以鼻咽癌为例
Diagnosis Related Groups Study Based on Decision Tree—Using Data of Nasopharyngeal Carcinoma (NPC)
DOI: 10.12677/AAM.2019.86130, PDF,  被引量    科研立项经费支持
作者: 曹 蕾, 柳岳霖, 何轶辉, 姜玉山:东北大学秦皇岛分校数学与统计学院,河北 秦皇岛
关键词: CARTBox-Cox变换DRGs鼻咽癌Kruskal-Wallis检验CART Box-Cox Transformation DRGs NPC Kruskal-Wallis Test
摘要: 根据影响疾病治疗费用的主要因素,本文基于决策树构建了鼻咽癌(NPC)诊断费用的预测模型,得到疾病诊断相关分组(DRGs)下费用更为精细的划分,为医疗保险资源的合理使用和分配提供合理的建议。数据提取自广东省某肿瘤医院,共计2064个鼻咽癌病案。本文通过以下三步对数据进行了处理和分析。首先,我们选取了病人的年龄、性别、TNM诊断分期以及住院天数等特征为预测变量。然后,使用Box-Cox变换方法提取接近正态分布的因变量。其后,使用分类回归树(CART)对不同因变量建立决策树,并得到分组,对DRGs分组下的单病种预付费得到了更为准确的预测模型。
Abstract: According to the major factors affecting the treatment expenses, this passage constructs a predic-tion model of treatment expenses of nasopharyngeal carcinoma(NPC) based on decision tree, and obtains its Diagnosis Related Groups, thus providing scientific basis for the allocation of resources and supervision of the health care insurance fund. Data were extracted from a tumor hospital in Guangdong Province, amounted to 2064 cases of nasopharyngeal carcinoma. We divide this analysis into 3 steps. Firstly, we choose the main factors of hospitalization expenses (HE), such as age, gender, TNM and duration of hospitalization. And then, we construct proper dependent variables that are approximately subject to normal distribution, by using Box-Cox Transformation. Additionally, we build up regression model using Classification and Regression Tree (CART) algorithm and get its modified DRGs. The grouping results, also as DRGs, of NPC cases based on CART and other Boosting algorithm are more reasonable and easier than those before.
文章引用:曹蕾, 柳岳霖, 何轶辉, 姜玉山. 基于决策树的DRGs制度研究——以鼻咽癌为例[J]. 应用数学进展, 2019, 8(6): 1121-1132. https://doi.org/10.12677/AAM.2019.86130

参考文献

[1] 林倩, 王冬, 郭煜, 詹志颖, 吴志明. 基于CHAID算法的阑尾炎患者DRGs分组研究[J]. 卫生经济研究, 2017(8): 29-32.
[2] 赵云. 医疗保险预付费方式控制医疗费用的机制研究[J]. 中国医院管理, 2015, 35(4): 45-47
[3] Luo, A.-J., Chang, W.-F., Xin, Z.-R., Ling, H., Li, J.-J., Dai, P.-P., Deng, X.-T., Zhang, L. and Li, S.-G. (2018) Diagnosis Related Group Grouping Study of Senile Cataract Patients Based on E-CHAID Algorithm. International Journal of Ophthalmology, 11, 308-313.
[4] 王若佳, 魏思仪, 赵怡然, 王继民. 数据挖掘在健康医疗领域中的应用研究综述[J]. 图书情报知识, 2018(5): 114-123+9.
[5] 丁中正, 刘云, 景慎旗, 张昕. 医疗数据挖掘综述[J]. 智慧健康, 2016, 2(10): 54-56.
[6] 杨之光. 医保单病种支付方式分析和支付标准预测[D]: [硕士学位论文]. 大连: 东北财经大学, 2017.
[7] 张凯. 数据挖掘技术在医疗费用数据中的应用研究[D]: [硕士学位论文]. 北京: 北京邮电大学, 2015.
[8] 周萍. 国外典型国家医疗费用支付方式经验及其借鉴[J]. 商业经济, 2016(7): 99-100.
[9] 孙丽, 梁力中, 吴进军. 基于大数据的基本医疗保险患者住院医疗费用因子分析[J]. 齐齐哈尔医学院学报, 2016, 37(18): 2326-2327.
[10] 茆诗松, 程依明, 濮晓龙. 概率论与数理统计教程[M]. 第2版. 北京: 高等教育出版社, 2011.
[11] 李航. 统计学习方法[M]. 北京: 清华大学出版社, 2012.
[12] 薛薇. R语言数据挖掘[M]. 第2版. 北京: 中国人民大学出版社, 2018.
[13] 机器学习之常见决策树算法[EB/OL]. https://shuwoom.com/?p=1452, 2018-10-19.
[14] 决策树算法原理及实现[EB/OL]. https://www.cnblogs.com/sxron/p/5471078.html, 2016-05-08.
[15] 吕晓玲, 宋捷. 大数据挖掘与统计机器学习[M]. 北京: 中国人民大学出版社, 2016.
[16] 阎玉霞, 徐勇勇. 病例组合分类结果的评价[J]. 中国卫生统计, 2007, 24(2): 163-164.
[17] 杜剑亮, 刘骏峰, 陈倩. 不同决策树算法建立DRGs模型的差异[J]. 中国病案, 2014, 15(7): 38-41.
[18] Robert I. Kabacoff. R语言实战[M]. 第2版. 北京: 人民邮电出版社, 2016.