遗传模糊聚类算法在数据关联中的应用

| 收藏本文 下载本文 作者:墙角一枝梅

以下是小编整理的遗传模糊聚类算法在数据关联中的应用(共含8篇),欢迎阅读分享,希望对大家有帮助。同时,但愿您也能像本文投稿人“墙角一枝梅”一样,积极向本站投稿分享好文章。

遗传模糊聚类算法在数据关联中的应用

篇1:遗传模糊聚类算法在数据关联中的应用

遗传模糊聚类算法在数据关联中的应用

针对传统数据关联算法存在计算量偏大或关联精度不高的问题,提出了一种利用遗传模糊聚类策略来求解数据关联问题的.算法.该算法将多传感器多目标的数据关联问题看作是一类约束条件下的组合优化问题,先通过对同一时刻不同传感器提供的量测按照其相似性用遗传算法进行模糊聚类,再用聚类后的等效量测对各目标的状态进行估计.聚类方式的改进不仅增加了算法的局部寻优能力,有效地减少了计算的复杂度,而且还具备一定的野值剔除能力.仿真结果表明该算法关联精度较高,计算量适中,具有一定的工程应用价值.

作 者:胡傲 冯新喜 王冬旭 郭威武 HU Ao FENG Xinxi WANG Dongxu GUO Weiwu  作者单位:空军工程大学电讯工程学院,西安,710077 刊 名:电光与控制  ISTIC PKU英文刊名:ELECTRONICS OPTICS & CONTROL 年,卷(期): 17(3) 分类号:V271.4 TN953 关键词:数据关联   多目标跟踪   模糊聚类   遗传算法  

篇2:改进模糊聚类算法及其在人力资源管理中的应用

改进模糊聚类算法及其在人力资源管理中的应用

对传统的'模糊聚类算法进行了改进.考虑了各评价指标的相关性及不同评价指标对所分析问题的重要程度.使模型能够更准确地反映实际问题.运用改进算法对人力资源问题进行了分析,验证了该算法的有效性.

作 者:WANG Hao 都忠诚 WANG Hao DU Zhongcheng  作者单位:天津师范大学管理学院,天津,300387 刊 名:天津师范大学学报(自然科学版)  ISTIC PKU英文刊名:JOURNAL OF TIANJIN NORMAL UNIVERSITY(NATURAL SCIENCE EDITION) 年,卷(期): 28(3) 分类号:O159 关键词:模糊聚类分析   相关性   人力资源管理  

篇3:模糊聚类在水质评价中的应用

模糊聚类在水质评价中的应用

摘要:文章提出了利用模糊聚类法对水质进行综合评价的新方法,并利用该方法对龙羊峡水库的水质进行了综合评价研究,其研究结果表明利用该方法对水质进行综合评价,具有理论严谨,实用合理以及计算简单的优点.作 者:韩佩琦    路金喜    宋双虎    张晓芳    杜贵荣    关珂    张文丽  作者单位:韩佩琦(河北科技大学,石家庄,050018)

路金喜,张晓芳,杜贵荣,关珂,张文丽(河北农业大学,保定,071001)

宋双虎(张河湾抽水蓄能电站,石家庄,050001)

期 刊:环境科学与技术  ISTICPKU  Journal:ENVIRONMENTAL SCIENCE & TECHNOLOGY 年,卷(期):, 30(z1) 分类号:X824 关键词:模糊聚类    水质    综合评价    欧氏距离   

篇4:模糊聚类和排序在植被演替研究中的综合应用

模糊聚类和排序在植被演替研究中的综合应用

应用模糊聚类和主成分分析(PCA)对黄土高原丘陵沟壑区植物群落演替进行研究,以探讨该方法在植被演替研究中的.可行性.研究结果表明,利用模糊聚类分析和主成分分析,可以将13个样地客观地划分为5个群系.结合不同群系的恢复时间,即可判定随时间变化而呈现出的植物群落演替序列:猪毛蒿群落-赖草群落-长芒草群落-铁杆蒿群落-沙棘群落.该演替序列与传统的研究结果基本相同,说明利用模糊聚类分析和主成分分析方法研究植被演替是可行的.同时该方法数学上较为严格,且计算简单、运算量小,精度较高、可在计算机上运算,可大大提高植物群落演替研究的定量化水平,在植被演替中具有较好的应用价值.

作 者:卜耀军 温仲明 焦峰 焦菊英  作者单位:卜耀军(西北农林科技大学资源环境学院)

温仲明,焦峰,焦菊英(中国科学院水利部水土保持研究所,陕西,杨陵,712100)

刊 名:水土保持研究  ISTIC PKU英文刊名:RESEARCH OF SOIL AND WATER CONSERVATION 年,卷(期): 12(1) 分类号:X176 D159 关键词:黄土高原丘陵沟壑区   植被自我修复   植物群落   模糊聚类   排序  

篇5:聚类算法及其在护理管理中的应用研究

聚类算法及其在护理管理中的应用研究

摘 要:在传统的医疗过程中,医护人员随机分配,患者被动接受治疗的护理管理模式不仅会浪费有限的医疗资源,使患者承受较高医疗费用,有时还会延误最佳治疗时机,引发并发症,给患者和其家庭带来更多的痛苦和困扰。文章通过将几种常见的聚类算法在护理管理中的应用进行比较,最终选择了先验假设较少的层次聚类算法,基于R语言探讨了哟尉劾嗨惴ǚ掷嗷だ砘颊叩氖迪止程,说明了层次聚类算法在患者与护理资源的最优匹配中的应用方法,为医院开展科学护理管理提供一定的参考依据。

关键词:聚类算法;护理管理;层次

中图分类号:TP399 文献标识码:A

Abstract:In the process of traditional healthcare,health care providers are randomly assigned and patients are passive to accept various treatments.Besides the high expense of medical treatment and the waste of limited medical resources,it would delay the best treatment time and cause complications,bringing great suffering to patients and their families.By comparing clustering algorithms,this paper chooses the hierarchical clustering algorithm with fewer priori assumptions.Based on R Language,this paper elaborates on the implementation process of hierarchical clustering algorithm in clustering patients,and the methods of using hierarchical algorithm to optimally match the patients and nursing resources,thus providing certain reference and basis to the scientific nursing management.

Keywords:clustering algorithm;nursing management;hierarchical

1 引言(Introduction)

护理管理是医疗机构以改善和提高医疗水平,合理利用医疗设备,最大程度发挥医护人员护理能力为目标的过程。然而,在传统的医疗护理管理过程中,医护人员随机分配,患者被动接受治疗方案,不仅会浪费医疗资源,使患者承受较高医疗费用,有时还会延误治疗,引发并发症,给患者和其家庭带来更多痛苦和困扰。随着信息化“智慧医疗”时代的到来,医院信息系统的普及,医疗数据采集、整理、分析不再受到传统人工操作在时间、效率、成本和疗效等方面的制约,取而代之的是高效、便捷、智能、科学的大数据分析处理过程。“互联网+医疗护理”的模式已悄然走近我们身边。许多学者开始尝试通过计算机算法精准识别患者、最优分配护理医生、优化患者转诊流程等方式来提高护理效果和降低医疗费用。在识别患者和分配医生时,为了更好地进行分类识别,聚类算法受到了广泛关注。

2 聚类算法(Clustering algorithm)

聚类就是按照“物以类聚”的思想,将抽象数据集划分成若干簇的过程,其中在每一簇中数据间具有高度的相似性[1,2]。聚类分析是当前数据挖掘中的重要手段。迄今,研究者已提出了多种聚类算法[3]。常用的聚类算法有基于划分、密度、网格、模型和层次的方法等[4]。

2.1 基于划分的聚类方法

基于划分的聚类方法需要提前设定聚类的数目,如K均值法和K中心点法等。这类方法分析时需要首先在数据集中随机选择聚类数目的对象,每个对象作为该聚类的中心或平均值,通过距离远近等方法将其余对象逐步聚类到每个类中。基于划分的聚类分析结果与初始值关系非常密切,不同的初始值往往会导致不同的聚类结果,通常会呈现出局部最优解。基于这种情况,基于划分的聚类方法在实际应用中往往要求穷举所有可能的划分。

2.2 基于密度的聚类方法

基于密度的聚类分析依据数据是否属于相连的密度域将数据对象进行归类。常用的基于密度的聚类算法为DBSCAN。这种聚类方法可以剔除噪声点,同时可以发现任意形状的聚类而不局限于球状的类[5]。但DBSCAN必须指定邻域半径和最少点数这两个参数,同时聚类的结果对这两个参数的依赖性很强。

2.3 基于网格的聚类方法

基于网格的聚类方法将空间分成有限数目的多维网格,利用网格结构实现聚类。如CLIQUE算法和STING算法。CLIQUE算法主要适用于处理高维数据,同时它综合了密度算法,可以发现其中的密集聚类。STING算法是一种将空间划分成直方形网格单元,不同方形对应不同分辨率,以实现聚类分析的方法[6]。

2.4 基于模型的聚类算法

基于模型的聚类算法是通过寻找数据对每个类预先设置好的模型的最佳拟合而实现的。最典型的基于模型的聚类算法是COBWEB算法。COBWEB算法不需要用户提供参数,可以自动划分簇的数目[7]。

2.5 基于层次的聚类算法

基于层次的聚类算法对数据集按照凝聚或分裂的层次方式进行聚类。凝聚型将每个对象看作一个单独的类,然后通过合并相近的类实现聚类。分裂型将所有数据归到一个类中,然后通过迭代,分层分裂成小类。常见的基于层次的聚类算法有CURE、ROCK和Chamelemon。Chamelemon算法在合并类的过程中,可以综合考虑类的内在特征、近似度和互连性,可以构造任意大小的聚集簇[8]。

2.6 几种聚类算法比较分析

基于模型的聚类算法要求对象在每个属性具有独立的概率分布,但在实际生活中,这种假设是不存在的。基于网格的聚类算法需要选择合适大小的单元数目,基于密度的聚类算法和基于划分的聚类算法需要用户设置一定的参数来产生可接受的聚类结果。在基于层次的聚类算法中,执行合并或分裂后无法回退修正,其质量受到一定的影响,但由于层次聚类算法无需提前知道最终所需的集群数量,其先验假设较少,因此通用性很强。目前,层次聚类算法已广泛应用于各个领域。

3 护理管理中聚类算法的应用研究(The application of clustering algorithm in Nursing management)

3.1 算法选择

在护理管理中,聚类可以帮助科研人员从医院信息管理系统中区分患者,聚类分析作为数据挖掘的重要分析方法,可以发现每类患者更深层次的信息,归纳总结出每类患者的个体特征和临床检验特征,有针对性的为患者提供精准治疗,减轻患者心理和财力方面的负担,缩短就医疗程,提高患者的生活质量。根据患者个体参数合理聚类患者往往不同于其他领域聚类分析。首先,患者的个体特征属性并不满足独立的概率分布。患者某项指标的偏离往往依赖于其他体征。其次,护理管理初期通过设置一定的参数来产生可接受的聚类结果,需要具备丰富的医学经验和较高的计算机理论水平,实际应用中难度很大。再者,患者病情差异较大,选择合适大小的单元数目可操作性较低。综合分析几种聚类算法,层次聚类算法需要的先验假设更少,对患者的聚类集群更科学,更适合当前大数据背景下医院开展科学、高效的护理管理,因此本文基于凝聚型层次聚类算法探讨聚类算法在护理管理中的应用。

3.2 数据预处理

护理管理中我们收到的患者数据往往具有异构性、冗余性、复杂性等特征,在对数据进行分析时首先需要进行集成、清理和归约[9]。

数据集成:患者个体数据来源主要有几个方面:(1)医学检验中心;(2)体检中心;(3)急诊科室;(4)门诊科室;(5)住院科室;(6)医学影像诊断中心;(7)社区卫生服务中心;(8)县级医院;(9)专科医院。不同的医疗机构对数据的存储格式、方法和实体的命名规则不同,在数据集成过程中需要考虑统一实体、删除冗余数据、处理冲突数据等。集成过程中可以考虑可视化分析和相关性分析等方法实现。

数据清理:由于医疗数据的特殊性,临床检验数据获取时间较长,人工填补缺失值困难大,而替代邻近值处理噪声数据又可能导致分析结果的不准确性,因此清理数据主要通过识别异常值并删除相应元组的方法实现。

数据归约:随着大数据时代的到来,可获得的患者个体数据越来越多,对患者属性进行归约处理可以有效地降低分析的时间复杂度,提高分析质量。因此,在分析过程中可以通过属性约简等方法归约处理数据。

3.3 基于R语言的层次聚类算法及其在护理管理中的应用

在数据预处理的基础上,将每个患者视为一类,利用欧几里得距离、曼哈顿距离、切比雪夫距离等方法计算出每类之间的相似度。接着,将相似度最高的合并为一个类,重复计算,直至相似度大于某个终止条件值时结束聚类。简言之,层次聚类算法是通过计算每个类中的数据点与所有数据点之间的距离来确定其相似性,距离越小,相似度越高[10]。在R语言中,具体实现步骤如下:

(1)计算距离矩阵:利用dist函数计算患者间的距离矩阵。

d<-dist(x,method=”euclidean”)

其中,x为患者数据集,method表示计算距离的`方法,常用的方法有euclidean、manhattan、maximum等。方法的选择可根据患者具体数据而不同。

(2)聚类分析:在距离矩阵的基础上,使用hclust( )函数合并聚类簇。

hc<-hclust(d,method=“ward.D2”)

其中,d为患者数据的距离矩阵,method表示合并的方法,常用的方法有complete、ward、median、average、centroid等。

(3)剪枝操作:在数据分析中,患者数据的层次聚类结果有时很复杂,cutree()函数可以实现对聚类结果的剪枝操作,分析时可综合层次聚类结果和医生数选择合适的聚类数。

clusterCut<-cutree(hc,k)

其中,k为层次聚类结果的指定聚类数。最佳聚类数的选择是层次聚类剪枝中最复杂的一个问题,可以使用mclust、Nbclust、factoextra等包计算出最优聚类数。

4 护理管理分析(The analysis of Nursing

management)

在实际护理管理中,广义上讲护理管理人员涵盖的范围不仅包括医院护士、家庭护理人员[11],还包括专家和医生。传统的护理管理中,专家、住院医生、护士随机分配和组合,往往会产生不同的治疗效果和医疗费用。为了改善这一现状,部分学者开始探讨优化护理流程、改善护理模式来提高护理质量。但这些方法虽然在某种程度上改善了护理质量,但护理方法的针对性较差。因此,在护理管理分析中,可以考虑事先仿真不同医生对每位患者的治疗效果。使用聚类分析方法,将患者进行科学分类,综合聚类结果、患者最终的治愈情况和医疗费用,发现每类患者的最佳护理者,从而为医院开展科学护理管理提供一定的参考依据。

5 结论(Conclusion)

随着“互联网+医疗护理”的发展,信息化技术在医学中的运用一定会越来越普及,越来越智能。我们探讨基于R语言的层次聚类算法在护理中的应用,就是要充分发挥层次聚类算法的先验假设较少的优点,可以直接对患者进行科学分类,达到患者与护理资源的最优匹配,既有效提高临床护理效率和效果,又能节省有限的医疗人力、物力、财力,最终达到医患关系的和谐融洽,相信随着互联网时代的到来,人工智能、计算机算法必将渗透到医疗护理的每一个环节,深入学习探讨各种算法在临床护理实际中的运用,将具有较大的科研和现实意义。

参考文献(References)

[1] 王有为,吴迪.聚类技术在医学数据中的应用[J].河南教育学院学报(自然科学版),,2:32-35.

[2] 李雪梅,张素琴.数据挖掘中聚类分析技术的应用[J].武汉大学学报,,42(3):396-399.

[3] 陈黎飞,姜青山,王声瑞.基于层次划分的最佳聚类数确定方法[J].软件学报,,19(1):62-72.

[4] Jiawei Han,MichelineKamber.范明,孟小峰,译.数据挖掘概念与技术[M].北京:机械工业出版社,:1-262.

[5] 杨海斌.一种新的层次聚类算法的研究与应用[D].兰州:西北师范大学,:8.

[6] 张鑫.层次聚类算法的研究与应用[D].赣州:江西理工大学,2008:19.

[7] 段明秀.层次聚类算法的研究及应用[D].长沙:中南大学,2009:9.

[8] 毕鹏.改进的Chameleon层次聚类算法在目标分群中的应用研究[D].杭州:浙江大学,2009:17.

[9] 尤婷婷.健康大稻菰ご理技术及其应用[D].成都:电子科技大学,:6-16.

[10] 张良均,谢佳标,杨坦等.R语言与数据挖掘[M].北京:机械工业出版社,2017(8):204-206.

[11] Katie M.Dean,Laura A.Hatfield,et al.Preliminary Data on a Care Coordination Program for Home Care Recipients[J].The American Geriatrics Society,2016(64):1900-1903.

作者简介:

降 惠(1983-),女,硕士,副教授.研究领域:医学计算机应用,数据挖掘.

篇6:模糊c-均值聚类法在干港选址中的应用

模糊c-均值聚类法在干港选址中的应用

为促进区域经济发展,更合理地进行干港选址,分析干港规划选址布局的影响因素,提出模糊c-均值聚类方法,认为模糊c-均值聚类法具有分析许多不确定性因素的优势,适应范围较广,且设计简单,在实际选址工作中易于将其转化成优化问题进行解决,其易于在计算机应用的'特点对验证干港选址的合理性具有一定的理论意义.

作 者:张兵 周海宁 ZHANG Bing ZHOU Haining  作者单位:张兵,ZHANG Bing(北京首荣货运代理有限公司,工程项目部,北京,100020)

周海宁,ZHOU Haining(长春理工大学,外语学院,吉林,长春,130022)

刊 名:水运管理 英文刊名:SHIPPING MANAGEMENT 年,卷(期):2009 31(2) 分类号:U6 关键词:干港   选址   模糊c-均值聚类法   集装箱运输  

篇7:模糊c-均值聚类法在土壤重金属污染空间预测中的应用

模糊c-均值聚类法在土壤重金属污染空间预测中的应用

摘要:基于93个土壤表层样品重金属Cu、Zn、Cr、Cd、Pb和Hg全量浓度分析数据,应用模糊分类方法结合地统计学手段,对南京市边缘带梅山钢铁厂附近总面积约14 km2样区内的土壤重金属污染状况进行了空间预测.结果显示,样区北部及东北角区域的土壤遭受重金属元素Cu、Zn、Cr、Cd的轻微污染,样区西侧沿长江呈带状分布的土壤由于其重金属环境容量较低,存在潜在污染风险,样区其它区域的`土壤未发现由上述重金属元素导致的污染现象.样区东北角土壤Pb、Hg污染严重,并与Cu、Zn、Cr、Cd污染在空间上重叠,是土壤重金属污染控制与土壤修复的重点区域.样区的东部和东北部区域土壤受Pb、Hg中度污染,在梅山集团的北部土壤轻微污染.研究表明,与直接对重金属浓度分析数据实施插值分析的常规克里格方法相比,模糊c-均值聚类结合地统计学方法获得的空间预测结果蕴含信息更加丰富,而模糊集理论及其相关算法在土壤学诸多领域中也具有极大的应用潜力.作 者:檀满枝    陈杰    郑海龙    张学雷    TAN Manzhi    CHEN Jie    ZHENG Hailong    ZHANG Xuelei  作者单位:檀满枝,TAN Manzhi(中国科学院南京土壤研究所土壤与农业可持续发展国家重点实验室,南京,210008;中国科学院研究生院,北京,100039)

陈杰,张学雷,CHEN Jie,ZHANG Xuelei(中国科学院南京土壤研究所土壤与农业可持续发展国家重点实验室,南京,210008)

郑海龙,ZHENG Hailong(香港中文大学地理与资源管理系)

期 刊:环境科学学报  ISTICPKU  Journal:ACTA SCIENTIAE CIRCUMSTANTIAE 年,卷(期):, 26(12) 分类号:X53 关键词:模糊c-均值算法    连续分类    空间预测    土壤污染    重金属   

篇8:模糊K近邻分类器在邻域风险最小化算法中的应用

模糊K近邻分类器在邻域风险最小化算法中的应用

在邻域风险最小化原则(VRM)中运用模糊K近邻分类器,来提出一种新的定义邻域半径的方法,从而得出一种新的VRM算法.实例证明这一新算法对解决稀疏小样本的.分类和回归有着较好的应用.

作 者:杞娴 殷英 戴琳 QI Xian YIN Ying DAI Lin  作者单位:昆明理工大学,理学院,云南,昆明,650091 刊 名:昆明理工大学学报(理工版)  ISTIC PKU英文刊名:JOURNAL OF KUNMING UNIVERSITY OF SCIENCE AND TECHNOLOGY(SCIENCE AND TECHNOLOGY) 年,卷(期):2007 32(6) 分类号:O235 关键词:支持向量机   模糊K近邻  

模糊数据挖掘在CRM中的应用

遗传优化模糊神经网络在组合导航系统中的应用

数据挖掘在CRM中的应用论文

模糊教学法在美术欣赏教学中的应用

大数据在知识管理中的应用论文

汉语谚语中关联法的应用

模糊物元模型在自然保护区生态评价中的应用

三角模糊数方法在水环境风险评价中的应用

MapGIS 在地球物理数据成图中的应用

基于AHP的模糊综合评价法在滑坡危险度评价中的应用

遗传模糊聚类算法在数据关联中的应用(共8篇)

欢迎下载DOC格式的遗传模糊聚类算法在数据关联中的应用,但愿能给您带来参考作用!
推荐度: 推荐 推荐 推荐 推荐 推荐
点击下载文档 文档为doc格式
点击下载本文文档