下书网

故事栏目

外国小说文学理论侦探推理惊悚悬疑传记回忆杂文随笔诗歌戏曲小故事
下书网 > 小故事

近年来大数据技术前沿与热点研究<br/>——基于2015—2021年VOSviewer相关文献的高频术语可视

时间:2023-04-12 07:28:01

近年来大数据技术前沿与热点研究<br/>——基于2015—2021年VOSviewer相关文献的高频术语可视一文创作于:2023-04-12 07:28:01,全文字数:22155。

近年来大数据技术前沿与热点研究<br/>——基于2015—2021年VOSviewer相关文献的高频术语可视

表人们对某一问题研究的重视程度和研究倾向。表1列出了2015—2021年Web of Science 核心合集中大数据领域排名前10的高被引论文。可以看出,大数据领域的三个主要研究方向为大数据挖掘、大数据运维、云计算。2021年我国围绕大数据技术的资金投入继续增加,大数据技术在实践落地的过程中也存在风险和挑战,在数据的运营和维护过程中,如何有效地管理和应用大数据技术,以及在大数据的价值转化过程中切实保障用户数据信息的安全,也是大数据领域需要研究和解决的问题。

表1 2015—2021年大数据领域排名前10的高被引论文列表

(续表1)

3 大数据领域高被引论文聚类分析

3.1 基于聚类谱系图的关键词共现分析

VOSviewer可以对文献知识单元进行关系构建,对数据信息进行可视化分析,从而绘制出可以展现某一领域的知识结构、演进和前沿热点的知识图谱,实现对关键词共现的聚类分析。将上述2015—2021年大数据领域高被引论文的174个关键词导出到txt文档,接着在Excel文档中整理这些关键词数据,依照出现频次重新排序,选取前20个高频关键词,得到大数据领域高被引论文关键词频次表(见表2)。

表2 大数据领域高被引论文的前20个高频关键词

VOSviewer软件可以生成聚类谱系图,将经过数据预处理的174个符合共现分析要求的关键词导入软件,设置聚类规则为最小聚类中包含的关键词不少于25个,通过统计和梳理大数据领域的高被引论文中各个关键词出现的频次,以及各个关键词之间的关联程度,以展现大数据领域的研究热点和结构分布。图2是VOSviewer对样本数据分析生成的关键词聚类谱系图,图中的结点表示在大数据领域高被引论文中共现的关键词,结点的大小表示该词共现的频次高低,结点越大,体现出其研究热度越高。

图2 2015—2021年大数据领域关键词聚类谱系图

图谱中有174个标签,3017条连接线,总体关联强度为6567。可以看出,2020—2021年间,大数据领域的研究形成了3个聚类,分别围绕“大数据开发与挖掘”(红色)、“大数据分析与管理”(蓝色)、“大数据运维与云计算”(绿色)这三个技术方向进行研究。

3.1.1 聚类一:大数据的开发与挖掘

这个类簇包含73个关键词,其中系统(system)、框架(framework)、计算机应用(applications)、算法(algorithm)、模型(model)、机器学习(machine learning)、人工神经网络(artificial neural networks)这些词的结点最大,是这个聚类的中心结点。而分布式计算系统(MapReduce)、数据融合(data fusion)、智慧农业(smart farming)、数字医疗保健事业(digital health)、智能电网(smart grid)、清洁生产(cleaner production)、碳排放(CO2emissions)等词,在该聚类的网络边缘。

从图2还可以看出,系统一词的结点最大,可见对于系统的开发是大数据领域的一个研究热点。大数据挖掘技术通过建模和构造相关算法便于人们在海量数据中获取信息。其中,算法是由基本运算和规定运算顺序构成的运算规则和步骤[5]。机器学习是对计算机模拟人类神经网络和学习行为的研究,计算机可以根据算法智能地进行大数据挖掘与分析,从而构建、丰富和完善自身知识网络结构,并通过建立数据模型,实现对同类型数据的预测分析。深度学习是一种含多隐层的多层感知器,起源于机器学习,卷积神经网络属于深度学习的范畴[6]。而机器学习属于人工智能的范畴,是人工智能的一个研究分支。在大数据时代,凭借大规模的数据信息,通过构建数据模型,不断改善人工智能对数据预测的准确性,研究更加科学合理的数据挖掘算法,实现对人类神经网络的模拟,构造大数据网络体系,从而获取信息。随着在采集、挖掘过程中的数据沉淀和积累,融合了数据库技术、人工智能和机器学习的大数据挖掘技术也不断得到优化。

近年来,人们越来越重视大数据技术和以大数据技术为支撑的人工智能技术。根据调查,11.1%的企业对大数据技术和人工智能技术的累计投资超过5亿美元,有84.1%的企业在大数据技术和人工智能方面已开展工作[7]。可以预见,这样的趋势在未来仍将继续。大数据技术的应用包括多个领域,如在农业、医疗保健事业和电网技术等方面的应用,此外,还可以看到,在大数据开发、大数据挖掘这两个技术方向的理论研究到技术落地的应用研究过程中,对大数据技术的清洁生产和碳排放也很关注。从大数据、大环保到大治理,大数据技术在环境管理和决策过程中发挥了越来越重要的作用。

3.1.2 聚类二:大数据分析与管理

这个类簇包含49个关键词,有大数据分析(big data analysis)、工业4.0(industry 4.0)、服务(service)、信息系统(information systems)、持续性(sustainability)、创新(innovation)、供应链管理(supply chain management)等结点较大的词,还有专业化生产系统(manufacturing systems)、数据科学(data science)、情感分析(sentiment analysis)、业务分析(business analytics)、竞争优势(competitive advantage)、用户认可(user acceptance)等结点较小的词。

大数据分析和管理技术与工业4.0的时代背景密切相关。工业4.0时代具有智能化、个性化、虚拟与现实相融合的特征[8]。人们的需求通过在网络留下的数据信息表现出来,通过大数据整合分析,可以实现产品生产和分发的定制化。社会生产朝着个性化定制、服务性产品和数据要素驱动产业新业态和新模式创新的方向前进和发展,企业在工业4.0时代需要应用大数据分析和管理技术,绘制目标群体的用户画像,通过对数据加工、系统分析,实现从大数据到具体信息又到服务的转化,进而做出科学决策,获得企业在自己产业领域的竞争优势。此外,还有对大数据技术的绩效评估和数据管理。信息数据的生产没有尽头,但是并非所有的数据都具有信息价值,也并非所有的数据都可以实现信息到服务的价值转换,如何对数据进行科学和可持续的管理以及对未来的发展趋势进行预测,在工业4.0时代受到广泛关注。

3.1.3 聚类三:大数据运维与云计算

这个类簇包含52个关键词,其中,互联网(internet)、云计算(cloud computing)、物联网(iot)、安全(security)、架构(architecture)、区块链技术(blockchain technology)、信息与通信技术(ict)是该聚类的中心结点。此外,处于网络边缘的结点主要有:数据共享(data sharing)、数

提醒您:因为《近年来大数据技术前沿与热点研究<br/>——基于2015—2021年VOSviewer相关文献的高频术语可视》一文较长还有下一页,点击下面数字可以进行阅读!

《近年来大数据技术前沿与热点研究<br/>——基于2015—2021年VOSviewer相关文献的高频术语可视》在线阅读地址:近年来大数据技术前沿与热点研究<br/>——基于2015—2021年VOSviewer相关文献的高频术语可视

热门书籍

热门书评

推荐小故事