百度自研国内首个开源图数据库:Apache HugeGraph 1.0.0 发布
IT之家 3 月 29 日动静,据百度平安官方动静,日前,Apache HugeGraph (incubating) 第一个 Apache Release 版本 1.0.0 已正式发布。
HugeGraph 是百度平安于 2017 年自主研发的国内首个开源图数据库,供给了一站式的千亿级大规模图数据的存储、在线查询、离线阐发才能,普遍利用于社交收集、告白选举、收集平安、金融风控、智能机器人等场景。
HugeGraph 于 2018 年开源,2022 年 1 月正式通过世界顶级开源组织 Apache 软件基金会的投票决议,以全票通过的优良表示正式成为全球首个加进 Apache 孵化的图数据库项目,同年 5 月正式进驻 Apache 开启孵化,促使国产图数据库走向世界。
截至IT之家发文,HugeGraph 在 GitHub 上具有 2200+ Stars。此外,项目总 Contributors 数量超越 80 名,社区版本下载量超越 2 万,并有超越 100 个社区用户、组织在利用,包罗网商银行、网易游戏、360 平安、滴滴、科大讯飞、虎牙曲播、CVTE、货拉拉等。
据介绍,Apache HugeGraph 1.0.0 版本在性能和适用性、易用性上做了大量改进和修复,包罗 25000+ 行 Pull Request 代码变动提交:
展开全文
在系统语言上,图数据库与图计算等组件均晋级适配 Java 11,已笼盖所有子项目,并新增撑持 Cypher 图查询语言,目前已同时撑持 Gremlin 与 Cypher 两大支流图查询语言;
在办事器上撑持更多内置图算法,包罗 16 个 OLAP 算法包罗:LPA、 Louvain、 PageRank、 Betweenness / Closeness / Eigencentrality Centrality、 RingsDetect 等,2 个 OLTP 算法,包罗:adamic-adar 和 resource-allocation;
在大规模并行图计算框架 (Computer) 上,撑持海量图数据的 MPP 计算,出格是扩散性 / 中心性等空间消耗大的算法,撑持 K8s Standalone (单机) 形式,预留 Yarn 接口可实现间接对接;
在大数据组件撑持上,新增撑持 Flink CDC 数据流式与同步导进、 Spark 批量导进数据、撑持 Bypass Server 形式,大幅进步了图数据库的在线 / 离线场景下的导进 / 导出 / 图迁徙性能和便利性;
在易用性上,供给一键 Server / Hubble 容器化 Docker 撑持,重构整合图周边东西链为 HugeGraph Toolchain 等 120 多项细节版本更新。
在系统语言上,图数据库与图计算等组件均晋级适配 Java 11,已笼盖所有子项目,并新增撑持 Cypher 图查询语言,目前已同时撑持 Gremlin 与 Cypher 两大支流图查询语言;
在办事器上撑持更多内置图算法,包罗 16 个 OLAP 算法包罗:LPA、 Louvain、 PageRank、 Betweenness / Closeness / Eigencentrality Centrality、 RingsDetect 等,2 个 OLTP 算法,包罗:adamic-adar 和 resource-allocation;
在大规模并行图计算框架 (Computer) 上,撑持海量图数据的 MPP 计算,出格是扩散性 / 中心性等空间消耗大的算法,撑持 K8s Standalone (单机) 形式,预留 Yarn 接口可实现间接对接;
在大数据组件撑持上,新增撑持 Flink CDC 数据流式与同步导进、 Spark 批量导进数据、撑持 Bypass Server 形式,大幅进步了图数据库的在线 / 离线场景下的导进 / 导出 / 图迁徙性能和便利性;
在易用性上,供给一键 Server / Hubble 容器化 Docker 撑持,重构整合图周边东西链为 HugeGraph Toolchain 等 120 多项细节版本更新。