本文转载自DataFunTalk,作者刘洋,Neo4j亚太区高级技术顾问。
导读:本文将探讨Neo4j的图数据科学平台,以及2.0版本的新功能。主要内容包括:
Neo4j图数据科学(GDS)的前世今生
Neo4j图数据科学平台
Neo4j GDS 2.0 版新特性
01 Neo4j图数据科学(GDS)的前世今生
Neo4j是业界最早推出图算法的厂商,图算法由早期的ALGO 3.5升级为了GDS 1.0,预示着Neo4j从算法平台向图数据科学平台的演进。
1. 是什么在驱动业务创新?
Neo4j的业务创新不是由数字驱动,而是在深入分析各个业务环节间关系的基础上,进行相应的业务变革,从而带来业务创新,因此关系是行为的最强预测因素。
例如:零售商超公司可以通过分析客户与产品间的关系进行产品推荐,通过分析商品门店与供应商之间的关系来优化供应链等。这些都是分析关系驱动业务的实际案例。而图数据库则是处理关系的最佳技术。
2. 什么是图数据科学?
顾名思义,图数据科学是一门综合了图查询、图算法、图可视化,在事物、关系上进行数据科学类研究和分析的技术。传统的关系数据库不擅长处理关系,图模型是建立在关系之上的,因此借助图数据科学可以获得更好的数据分析和预测的结果。
3. 更佳的预测结果
现有的ML方法和技术主要基于维度和指标特征建立的特征工程,忽略了数据中的网络/图结构。图机器学习不仅可以识别个体特征,还能识别个体所处的网络特征,基于关系进行建模和预测。图可以为机器学习模型提供高度可信和精准的特征预测。
例如信用卡异常用户的检测,可以由基于特征模式的传统机器学习的欺诈检测系统完成。比如一个超大额的交易或是同一时间超远异地交易等,这种个体的异常特征很容易被传统的欺诈检测方法识别到。如果欺诈者在实施欺诈的过程中仍然表现出正常行为,又该如何进行检测?研究表明70%以上的看似正常行为的欺诈都是团伙欺诈,比如互相套用真实身份信息做一些看似正常的交易,这种团伙欺诈就很难被传统的欺诈检测系统发现。而图数据科学正是识别这类团伙关系的最佳方案。
02 Neo4j图数据科学平台