近年来大数据技术前沿与热点研究<br/>——基于2015—2021年VOSviewer相关文献的高频术语可视
时间:2023-04-12 07:28:01
近年来大数据技术前沿与热点研究<br/>——基于2015—2021年VOSviewer相关文献的高频术语可视一文创作于:2023-04-12 07:28:01,全文字数:22155。
近年来大数据技术前沿与热点研究<br/>——基于2015—2021年VOSviewer相关文献的高频术语可视隐私(data privacy)、边缘计算(edge computing)、雾计算(fog computing)、云(cloud)、智慧城市(smart city)等。信息网络系统与物理网络信息系统进行融合,出现物联网、工业物联网等新兴概念。社交媒体每天都制造大量的数据信息。《我们究竟产生了多少数据?》一文曾预测,到2055年全世界将产生高达175 ZB的数据[9]。分布式计算使企业可以更加方便快捷地处理社交媒体上规模巨大的数据信息,通过大数据应用程序对数据进行挖掘和分析,从而绘制用户画像,提供个性化的服务和服务性产品。在碎片化信息时代,数据也是碎片式的,如何面对这些碎片式的数据构建数据模型是大数据技术发展应用的一个挑战,并且在构建数据模型的过程中,数据源并非全部真实可靠,有些信息涉及个人隐私或国家机密,难以获取完整的数据信息,因此数据质量难以保证。此外,互联网带来了数据的流动共享,人们在互联网中的所有行为都会留下数据信息印记,而数据信息的传播不再受限于空间和时间,可以大量无成本扩散,对数据的隐私保护与安全带来巨大挑战。同时,数据的流动共享还带来数据泄露的风险,无论从个人数据权利出发还是从国家数据利益出发,都需要对数据流动共享给予一定的限制。构建大数据监控报警体系,可以保证数据的可靠与安全。
人们的生活与互联网的关联程度比以往更加紧密,例如以数字化为特征的智慧城市建设,实现数据信息安全是建设智慧城市的重要内容和评价标准之一。根据美国国家标准技术研究院的统计,云计算涉及的安全问题主要在虚拟机隔离、数据保护、云计算体系结构、身份访问与控制等多个方面[10]。云计算是以分布式计算为特征的技术,通过云计算,各种数据和信息可以从一台计算机提供给另一台计算机。在云计算环境中,虚拟的操作系统建立在服务器上,数据信息都储存在服务器中,比如用户上传的身份认证信息。数据信息一旦被上传到云中,用户便不再拥有对数据的控制权,一旦服务器遭到入侵,用户数据就会被盗取,从而造成数据泄露。此外,区块链技术与比特币密切相关,通过对数据的层层处理改变数据存储形式,将区块链技术应用到数据隐私保护与安全,数据在网络中的流动将会更有保障。
3.2 基于标签视图的关键词演化分析
使用VOSviewer软件对2020—2021年大数据领域关键词进行演化分析,生成关键词标签视图(图3)。视图中结点的颜色表示关键词出现的平均年份,结点的大小表示关键词共现频次的高低。从2015年到2021年颜色逐渐由蓝到黄,从中可以看出大数据领域研究热点的演变。
图3 2015—2021年大数据领域关键词标签视图
图3中,近几年大数据研究的关键词大多集中出现在2018年,有较高共现频次的关键词集中分布在2017—2018年。2015—2016年有关大数据的论文发表数量较少。由于大数据技术发展极快,相关的研究论文越来越多,到2021年大数据相关研究的论文数量从每年331篇增长至2075篇,出现的高共现频次的关键词有:系统(system)、挑战(challenges)、大数据分析(big data analysis)、物联网(iot)、云计算(cloud computing)、工业4.0(industry 4.0)、框架(framework)、模型(model)、算法(algorithm)、机器学习(machine learning)、隐私(privacy)、区块链技术(blockchain technology)。可以看出,大数据分析、数据管理、数据模型、云计算的研究热度比较高,是大数据领域的研究热点。此外,2019—2021年间出现了边缘计算(edge computing)、安全(security)、数据隐私(data privacy)、企业绩效(firm performance)、数字双胞胎(digital twin)、工业4.0(industry 4.0)、人工智能(artificial intelligence)、区块链技术(blockchain technology)、循环经济(circular economy)等关键词,对大数据技术的研究更加深入,理论研究的广度和深度进一步提高,从对单一技术到技术群,再到“技术+管理” “技术+运维”,可以看出,数据安全与隐私保护方面的技术受到重视,相关技术的研究是近年来的新兴热点。
3.3 基于密度视图的热力分析
关键词密度视图可以对相关领域的研究重点予以可视化。通过对2020—2021年大数据领域关键词密度视图进行热力分析,可以了解大数据领域的研究现状。如图4中,可以看出大数据分析(big data analytics)、系统(system)、机器学习(machine learning)、挑战(challenge)、物联网(iot)、工业4.0(industry 4.0)、云计算(cloud computing)这些词的密度最高,可见大数据的开发、挖掘、分析、管理、运维与云计算这几个技术方向的研究最受学者关注。
图4 2020—2021年大数据领域关键词密度视图
4 结语
对科技术语和高被引论文进行统计分析并加以解读,能够了解学科领域的研究前沿和热点。借助计量分析法以及科学知识图谱分析,通过知识图谱软件VOSviewer对大数据领域2015—2021年高被引论文中的关键词进行可视化呈现,并对其进行共现分析解读,最终得出如下结论:
(1)近年来大数据领域的研究热点主要集中在三个方向。一是大数据开发与挖掘。如大数据处理系统、应用程序、建模、算法以及与大数据相关的数据库技术、人工智能与机器学习;二是大数据分析与管理。大数据并不是简单的建模、算法,也不只是对数据的挖掘整理,而是通过系统分析将数据转化为信息,为国家、企业和个人做出科学决策提供依据;三是大数据运维和云计算技术。大数据是海量的,人们接收的数据信息与日俱增,与此同时每个人又都是大数据生产的参与者,人们的生活与大数据的联系更加紧密,机构与个人数据的隐私与安全越来越得到重视。
(2)大数据技术研究在推进数字化社会的进程中起到重要作用。大数据开发与挖掘、大数据分析与管理、大数据运维与云计算在数字化社会的建设进程中必不可少。大数据开发与挖掘的研究能够推动机器学习更加完善,促进构建智能化知识网络,推动人工智能的发展;对云计算技术和区块链技术的研究能够为数据安全提供保障,推动智慧城市的建设。
(3)数字化、智能化、网络化是大数据技术的未来发展方向,数据安全是大数据领域未来的研究热点。从2015—2021年大数据领域高被引论文关键词的演化分析也可以看到,近年来,尤其是2019—2021年,随着对数字技术研究的深入,学者对循环经济和数字安全更加重视,在数字化、智能化和网络化的时代背景下,数据技术也朝数字化、智能化和网络化的方向发展,数字安全是智慧城市的评价标准,也是数字化社会的评价标准。数字安全将成为未来大数据领域的重要研究方向之一,相关的区块链技术将成为研究热点。
《近年来大数据技术前沿与热点研究<br/>——基于2015—2021年VOSviewer相关文献的高频术语可视》在线阅读地址:近年来大数据技术前沿与热点研究<br/>——基于2015—2021年VOSviewer相关文献的高频术语可视