基于人工蜂群与K-Means的改进混合聚类算法
Improved Hybrid Clustering Algorithm Based on Artificial Bee Colony Algorithm and K-Means Algorithm
DOI: 10.12677/AIRR.2020.92011, PDF,  被引量    国家自然科学基金支持
作者: 包婉莹, 罗小玲*, 潘 新:内蒙古农业大学,计算机与信息工程学院,内蒙古 呼和浩特
关键词: 全局人工蜂群算法K-Means适应度函数聚类分析Global Artificial Bee Colony Algorithm K-Means Fitness Function Cluster Analysis
摘要: 为了克服K-Means聚类算法过度依赖初始聚类中心、容易陷入局部最优的缺点以及人工蜂群算法因为搜索策略的局限而导致的易早熟,收敛速度慢的问题,提出了改进的全局人工蜂群算法与K-Means++算法相结合的混合聚类方法,充分利用改进的全局人工蜂群算法可以全局寻优的特点与K-Means++算法能够优化初始聚类中心位置并且收敛速度快的特点,将二者融合,使得K-Means可以进行全局搜索,跳出局部最优解,并用UCI数据库中的Wine数据集和Balance-Scale数据集进行实验。结果表明,改进的全局人工蜂群算法较标准人工蜂群算法收敛速度更快,寻优效果更好;本文提出的混合聚类算法与原始K-Means算法相比,稳定性更好,迭代次数减少,收敛速度更快,而且聚类效果也有了明显改善。
Abstract: In order to overcome the disadvantages of K-Means clustering algorithm, such as over dependence on the initial clustering center, easily falling into local optimum, and the premature and slow con-vergence of the artificial bee colony algorithm due to the limitations of search strategies, a hybrid clustering method combining the improved global artificial bee colony algorithm and K-Means++ algorithm is proposed, which makes full use of the characteristics of the improved global artificial bee colony algorithm and K-Means++ algorithm. It can optimize the location of the initial clustering center and the convergence speed is fast. By combining the two, K-Means can search globally and jump out of the local optimal solution. The experiments are carried out with the Wine data set and balance-Scale data set in the UCI database. The results show that the improved global artificial bee colony algorithm has faster convergence speed and better optimization effect than the standard artificial bee colony algorithm. Compared with the original K-Means algorithm, the hybrid clustering algorithm proposed in this paper has better stability, fewer iterations, faster conver-gence speed and better clustering effect.
文章引用:包婉莹, 罗小玲, 潘新. 基于人工蜂群与K-Means的改进混合聚类算法[J]. 人工智能与机器人研究, 2020, 9(2): 92-99. https://doi.org/10.12677/AIRR.2020.92011

参考文献

[1] 廖伍代, 朱范炳, 王海泉, 孙雪凯. 基于人工蜂群优化的K均值聚类算法[J]. 计算机测量与控制, 2018, 26(4): 136-138.
[2] 杨俊闯, 赵超. K-Means聚类算法研究综述[EB/OL]. 计算机工程与应用(网络首发论文).
http://kns.cnki.net/kcms/detail/11.2127.TP.20191015.1136.006.html, 2019-10-15.
[3] 刘薇, 刘伯嵩, 王洋洋. 基于改进鱼群和K-Means的混合聚类算法[J]. 计算机工程与应用, 2013, 49(22): 119-122.
[4] 喻金平, 张勇, 廖列法, 等. 一种改进的混合蛙跳和k均值结合的聚类算法[J]. 计算机工程与科学, 2016, 38(2): 356-362.
[5] 熊众望, 罗可. 基于改进的简化粒子群聚类算法[J]. 计算机应用与研究, 2014, 31(12): 3550-3552.
[6] 邓海, 覃华, 孙欣. 一种优化初始中心的K-Means聚类算法[J]. 计算机技术与发展, 2013, 23(11): 42-45.
[7] Lu, B. and Ju, F. (2012) An Optimize Genetic K-Means Clustering Algorithm. CSIP 2012: Proceedings of the 2012 International Con-ference on Computer Science and Information Processing, 2012, 1296-1299.
[8] 刘三阳, 张平, 朱明敏. 基于局部搜索的人工蜂群算法[J]. 控制与决策, 2014, 29(1): 123-128.
[9] 葛宇, 梁静, 王学平. 基于极值优化策略的改进的人工蜂群算法[J]. 计算机科学, 2013, 40(6): 247-251.
[10] 周长喜, 毛力, 吴滨, 等. 基于当前最优解的人工蜂群算法[J]. 计算机工程, 2015, 41(6): 147-151.
[11] 毕晓君, 宫汝江. 一种结合人工蜂群和k-均值的混合聚类算法[J]. 计算机应用研究, 2012, 29(6): 2040-2042.
[12] 喻金平, 郑杰, 梅宏标. 基于改进人工蜂群算法的k均值聚类算法[J]. 计算机应用, 2014, 34(4): 1065-1069.
[13] Zhu, G.P. and Kwong, S. (2010) Gbest-Guided Artificial Bee Colony Algorithm for Numerical Function Optimization. Applied Mathematics and Computation, 27, 1341-1348.
[14] 罗可, 易斌. 一种基于改进蜂群的K-Means聚类算法[J]. 长沙理大学学报(自然科学版), 2016, 13(4): 85-89.
[15] 常扣扣. 基于改进人工蜂群算法的K-Means聚类算法[D]: [硕士学位论文]. 兰州: 兰州交通大学, 2017.