基于知识图谱的自闭症谱系障碍研究主题分析

来源:期刊VIP网所属分类:临床医学发布时间:2020-11-16浏览:

  [摘要] 自闭症是一种广泛性發育障碍的疾病,近几年的自闭症患者数量不断增加。该文选取自闭症相关研究文献,从PubMed数据库中抽取自闭症相关文献,通过发文量统计发现自闭症研究文献呈现指数上涨趋势且在2016年达到顶峰。运用词频分析法截取相关高频词制作关键词词云发现随着自闭症患者年龄的不断增长,研究者较为关注自闭症的共病问题。利用中心性分析、共词分析和社会网络分析方法,通过VOSviewer可视化软件形成了6个研究主题的聚类,分别为自闭症的相关基础理论研究、致病因素研究、表型症状研究、临床诊断研究、干预措施研究、共病研究,并基于知识图谱对自闭症研究相关文献进行主题分析,从发文量和研究热点角度探究自闭症的研究现状及发展趋势,为科研人员提供参考依据。

  [关键词] 自闭症谱系障碍;知识图谱;主题分析

医学卫生论文

  自闭症谱系障碍(autism spectrum disorder,ASD),又称孤独症,是一种发育障碍类疾病。美国在2013年颁布了《精神疾病诊断与统计手册—第5版》(DSM-5),并以自闭症谱系障碍替代了除雷特氏症以外的广泛性发育障碍[1]。目前,自闭症多高发于儿童,且男女比例差异明显,男孩多于女孩。其主要特征为社交互动障碍、语言沟通障碍和重复刻板行为等[2]。然而自闭症的病因尚不明确,但有研究[3]认为与遗传、免疫、代谢、肠道菌群和环境等因素密切相关。近几十年来,自闭症谱系障碍(ASD)的发病率持续上涨,根据美国疾病控制与预防中心CDC估计,大约每59名儿童中就有1名被确诊患有自闭症谱系障碍。随着医学技术和医疗信息化等技术的迅速发展,生物医学数据呈现出爆发式增长的趋势[4],以此为基础的生物医学文献数量也急剧增长。生物医学文献中蕴含着大量的生物医学知识,及时从中获取有效的信息就显得尤为重要。该文基于知识图谱方法研究自闭症相关文献,了解自闭症研究现状并探究其发展趋势,为科研人员提供参考依据。

  1 数据与方法

  1.1 數据来源

  该研究数据来自于 PubMed 生物医学文献数据库,通过MeSH词检索到9个与自闭症相关的医学主题词分别为autistic disorder(自闭症);autism spectrum disorder (自闭症谱系障碍);rett syndrome rett (综合征);akinetic mutism (动力学缄默症);macrocephaly autism syndrome (自闭症综合征);AUTS2 protein, human AUTS2 (蛋白,人);Auts2 protein, mouse(Auts2 蛋白,小鼠); Adenylosuccinate lyase deficiency(腺苷酸琥珀酸裂解酶缺乏);GoPro49 protein, human(GoPro49 蛋白,人类),以OR并列构建其检索式,共收集到自闭症相关的研究文献29 458篇(检索时间为2019年5月13日)。

  1.2 研究方法

  ①词频分析法。词频分析法是一种文献计量方法,其中关键词或主题词是文献的主要核心内容。因此通过统计关键词、主题词等核心词汇在某一领域文献中所出现的频次, 进而揭示该领域的研究热点及发展趋势[5]。通过词频的高低可以反映出一定的社会现象[6]。该文从PubMed数据库中下载XML题录数据,利用Kettle软件进行解析,从中抽取出Title、Year、Keywords关键字段。对其进行数据归一化处理,删除重复无关数据,从中截取出频次>10的关键词共769个,根据关键词在自闭症相关文献中的词频情况,预测自闭症研究的发展方向及趋势。

  ②中心性分析法。中心性分析方法可以反映出节点在网络中的重要程度。该文选用3种中心性分析方法,分别为点度中心性(degree centrality)、中介中心性(betweenness centrality) 和亲近中心性(closeness centrality)。其中点度中心性代表与该关键词节点的连线数量。中介中心性是指节点对网络的控制能力。亲近中心性是指与其他关键词节点的最短距离的大小。

  ③共词分析法。共词分析法是一种基于关键词的共现分析方法,表示某一领域中关键词共同在同一篇文献中出现的次数,并且次数越多越说明它们关系紧密、距离越短。运用共词分析方法构建共现矩阵,从而反映关键词之间的紧密程度并进一步分析其领域结构[7]。该文利用关键词共现建立共现矩阵,并以此为依据构建共现网络。

  ④社会网络分析法。社会网络分析法(social network analysis,SNA)是一种科学的计量方法,主要是对社会关系网络结构及其属性进行分析研究从而发现其内在联系的一种学科交叉的方法[8]。社会网络由图中的节点和连线构成,其中节点表示事件中的行动者,连线代表行动者之间的关系纽带。社会网络分析的优势在于可根据网络结构与网络位置对多个节点和多个主体网络进行合理分析并加以预测[9]。该文通过共现关系自建网络,反映关键词节点之间的关联关系,并通过VOSviewer软件进行可视化。

  2 结果与分析

  2.1 发文量分析

  由图1可以看出自闭症研究相关文献总体上呈现逐年上涨趋势,且增长幅度较大呈指数增长趋势。自闭症文献数量从1946年开始缓慢增长,初期较为平稳。从2001年开始持续增长迅速到2008年达到一个小高峰,2008年联合国将每年的4月2日定为“世界自闭症日”[10],以提高人们对自闭症患者的关注度以及对自闭症早期干预的研究。在2010—2014年间研究人员对于自闭症的关注度稍有下降,但在2016年迅速上升达到高点,说明近几年来,随着自闭症患者的不断增长,研究人员对自闭症研究的关注度越来越高。

  2.2 高频关键词分析

  从自闭症相关文献中截取频次>10的关键词共769个,通过WordArt在线词云制作工具绘制关键词词云,见图2,频次排名前10的关键词主要有Autism Spectrum Disorder(自闭症)、Intellectual Disability(智力障碍)、Children(儿童)、anxiety(焦虑)、Schizophrenia(精神分裂症)、ADHD(注意缺陷多动障碍)、Diagnosis(诊断)、adult(成人)、Development(发展)、Social Cognition(社会认知),可以看出自闭症多发生于儿童,然而随着自闭症患者年龄的增长,研究人员对成人自闭症患者的关注也逐年增长。同时对自闭症患者与注意缺陷多动障碍、精神分裂症、焦虑等的共患病情况也受到了更多关注。

  2.3 研究主题分析

  通过自建网络并采用关联强度进行主题聚类,同时采用VOSviewer软件对其进行可视化,图中节点大小表示关键词频次的高低,连线代表关键词之间的关联程度,见图3,整个研究主题以“Autism Spectrum Disorder自闭症谱系障碍”为中心构成一个基于关键词共现形成的知识图谱,并根据关联强度自闭症知识图谱被聚为6个研究主题,分别为如下几方面。

  ①自闭症的相关基础理论研究。随着自闭症患者数量逐年增加,研究人员对自闭症的关注度不断上升,在自闭症的相关基础理论研究主题下,研究人员主要对自闭症不同年龄段的患者包括儿童、青少年、成人的患病率、性别差异等基础信息进行统计学分析,并对患者的心理健康、生活质量和睡眠压力、情绪调节方面进行评估。根据词频和中心性分析可以看出图中的高频关键词有“children(儿童)”“diagnosis(诊断)”“adult(成人)”“intervention(干预)”“assessment(评估)“epidemiology(流行病学)”等。其中3种中心性在整个网络中都处于靠前位置,说明该主题为自闭症的基础理论研究,且对其他主题都有支撑作用。主要针对不同年龄段的人群包括儿童、成人及患者的兄弟姐妹的患病情况、诊断情况及生活情况进行宏观描述,并根据患者的心理健康、社会技巧、睡眠质量。常用的分析方法有Meta分析、随机对照实验、流行病学研究等。

  推荐阅读:医学类课题安排什么位置评职称

期刊VIP网,您身边的高端学术顾问

文章名称: 基于知识图谱的自闭症谱系障碍研究主题分析

文章地址: http://www.qikanvip.com/lcyx/54192.html