• Neo4j图数据科学及2.0版本新功能介绍


    本文转载自DataFunTalk,作者刘洋,Neo4j亚太区高级技术顾问。

     

    导读:本文将探讨Neo4j的图数据科学平台,以及2.0版本的新功能。主要内容包括:

    • Neo4j图数据科学(GDS)的前世今生

    • Neo4j图数据科学平台

    • Neo4j GDS 2.0 版新特性

    01 Neo4j图数据科学(GDS)的前世今生

    Neo4j是业界最早推出图算法的厂商,图算法由早期的ALGO 3.5升级为了GDS 1.0,预示着Neo4j从算法平台向图数据科学平台的演进。

    1. 是什么在驱动业务创新?

    Neo4j的业务创新不是由数字驱动,而是在深入分析各个业务环节间关系的基础上,进行相应的业务变革,从而带来业务创新,因此关系是行为的最强预测因素

    例如:零售商超公司可以通过分析客户与产品间的关系进行产品推荐,通过分析商品门店与供应商之间的关系来优化供应链等。这些都是分析关系驱动业务的实际案例。而图数据库则是处理关系的最佳技术。

    2. 什么是图数据科学?

    顾名思义,图数据科学是一门综合了图查询、图算法、图可视化,在事物、关系上进行数据科学类研究和分析的技术。传统的关系数据库不擅长处理关系,图模型是建立在关系之上的,因此借助图数据科学可以获得更好的数据分析和预测的结果。

    3. 更佳的预测结果

    现有的ML方法和技术主要基于维度和指标特征建立的特征工程,忽略了数据中的网络/图结构。图机器学习不仅可以识别个体特征,还能识别个体所处的网络特征,基于关系进行建模和预测。图可以为机器学习模型提供高度可信和精准的特征预测。

    例如信用卡异常用户的检测,可以由基于特征模式的传统机器学习的欺诈检测系统完成。比如一个超大额的交易或是同一时间超远异地交易等,这种个体的异常特征很容易被传统的欺诈检测方法识别到。如果欺诈者在实施欺诈的过程中仍然表现出正常行为,又该如何进行检测?研究表明70%以上的看似正常行为的欺诈都是团伙欺诈,比如互相套用真实身份信息做一些看似正常的交易,这种团伙欺诈就很难被传统的欺诈检测系统发现。而图数据科学正是识别这类团伙关系的最佳方案。

    02 Neo4j图数据科学平台

  • 相关阅读:
    C#多线程编程技术——多线程操作(没看懂)
    使用huggingface的text embedding models
    输出调节求解跟踪问题(二阶线性系统)
    Xshell远程登录 Linux小键盘数字输入变成字母解决办法
    C/C++字符函数和字符串函数模拟实现与详解————长度不受限制的字符串函数
    浏览器缓存的优化方案和思路
    python设计模式(三)--结构类设计模式
    探索跨境电商产品开发流程的最佳工具
    再见 Typescript,你好 Javascript 原生打字 ✨
    raise EOFError(“No data left in file“) EOFError: No data left in file
  • 原文地址:https://blog.csdn.net/Jennifer726/article/details/126764626