2019.NO1“大数据聚类专题”专家点评
发布人:administrator 发布时间:3/26/2019 11:10:21 AM  浏览次数:1436次
【字体: 字体颜色


<

  《深圳大学学报理工版》2019NO1首创刊发“大数据聚类专题”,特别引人注目,此专题由陈国良院士领衔主笔,陈院士长期研究计算机理论及算法并涉及到大数据与人工智能等领域,由他亲自出面主持可见学报对此专题的重视。专题共六篇论文,集中探究大数据聚类专题,除陈院士对专题作的统一论述(2019.NO1《大数据聚类专题序言》)外,专题中的五篇文章可分三类:
  第一类为对聚类研究的综述性分析一篇(2019.NO1《大规模数据集聚类算法的研究进展》);
  第二类为聚类理论性研究—算法研究三篇(2019.NO1《基于二部图的快速聚类算法》、《基于分层抽样的不均衡数据集成分类》、《面向分类型矩阵数据的无监督孤立点检测算法》);
  第三类为聚类应用性研究一篇(2019.NO1《增量学习的优化算法在app使用预测中的应用》)。

  这三类全方位对大数据聚类方法作了较为全面的探究,组成了一个完整的研究体系。下面从三个方面对此专题作评价:
  符合党和国家要求、契合深圳市发展方向
  大数据、人工智能等学科不同于一般学科,由于它的重要性,近年来已被党和国家提升为战略性学科,它具有引领整个高科技的发展、引领整个国家生产力发展,为实现两个奋斗目标具有指标性意义。而深圳是当前粤港澳大湾区建设中四大核心城市之一,又以技术创新为其主要发展特色,同时也是大湾区中建立统一大数据中心的四个城市之一。因此《深圳大学学报理工版》以大数据学科为专题完整的对其中的一个重要的研究方向作系统性的研究与探讨,符合党和国家要求又契合深圳市的发展方向,具有重大的意义和价值。
  群集分布式计算方法是大数据分析的主要方法
  2019.NO1《大规模数据集聚类算法的研究进展》,属综述性分析文章,它提出了大数据分析中一个具有方向性的研究问题,即在大数据分析中有很多研究内容属多学科重合性的,对其研究的内容与方法实际上是有重大区别的,所产生的效果也是不一样的。如聚类方法在大数据中属大数据分析,在人工智能中属机器学习,在传统数据(如数据库)中属数据挖掘,但目前人们往往将其混在一起研究,造成了理论上的严重失误。该文提出了大数据分析方法的特性,同时也明确给出了具体方法,即群集分布式计算方法是当前大数据分析的主要研究方法。群集分布式计算方法,即数据并行计算方法,它有别于目前机器学习和数据挖掘中的一些计算方法。这种思想方法对目前大数据分析研究具有指导性意义。
  注重大数据应用研究
  在大数据研究中有理论性研究与应用性研究之分,在目前的研究中有重理论性研究而轻应用性研究的趋势。殊不知,大数据之所以上升成为为国家级战略性学科,主要就是由于它的应用性能产生重大的经济效益及社会效益所致,因此,在注重理论研究的同时也一定要同时注重应用研究。而在此专题中,不但有理论性研究论文,同时还有应用性研究论文,2019.NO1《增量学习的优化算法在app使用预测中的应用》即属应用性研究论文。


南京大学 徐洁磐


  作为一名目前正在从事大数据医疗分析和挖掘的青年学者,本人在同行的推荐下研读了《深圳大学学报理工版》2019年第1期中的大数据专题,发现该专题对于大数据聚类领域的从业人员很有帮助。
  该专题由陈国良院士做序,陈院士高屋建瓴,对大数据研究的三个时期划分非常精准。本人强烈推荐专题中的《大规模数据集聚类算法的研究进展》,这是当前最新的对大数据聚类研究现状的总结,很是精彩。
  由于本人目前正在从事大数据方面的研究工作,将来将尝试将专题中收录的《基于二部图的快速聚类算法》应用于具体的医疗数据分析中,期待获得好的研究成果。

天津大学 兰燕飞


『 发表评论 』
标 题:
用 户 名:
验 证 码:
留言内容: