首页游戏资讯【金猿投融展】涛思数据——专注时序大数据的处理

【金猿投融展】涛思数据——专注时序大数据的处理

misa2 03-05 4次浏览 0条评论

北京涛思数据科技有限公司( TAOS Data ) 瞄准日益增长的物联网数据市场,专注时序空间大数据的存储、查询、分析和计算,不依靠任何开源或第三方软件,开发了拥有自主知识产权、100% 自主可控的高性能、分布式、支持SQL的时序数据库 TDengine。TDengine 可广泛运用于物联网、车联网、工业互联网、IT运维等领域。公司已经申请多项技术发明专利,且全部提交 PCT 专利申请。

2017.6月公司成立,截止2022年公司规模90+。

重要产品及服务能力

涛思数据作为一家高科技企业,针对物联网、工业互联网、金融、IT 运维监控等场景,独立研发了开源、云原生的时序数据库 TDengine,它能让大量设备、数据摘集器天天产生的高达 TB 甚至 PB 级的数据得到高效实时的处理,对业务的运行状态进行实时的监测、预警,从大数据中挖掘出商业价值。

2022 年,云原生时序数据库 TDengine 3.0 正式发布。作为一个云原生,而不只是能在云上运行的时序数据库,TDengine 彻底具备了云原生数据库的几大特征:水平扩展性、弹性、韧性、可看测性以及运维自动化。

展开全文

自 2018 年商业化版本发布后,TDengine 已经在全球 400 多个城市中,被广泛使用在了物联网、工业互联网、IT运维、车联网、能源和金融等各行业,为各企业的数字化改造和转型、效率提升以及存储、运维成本降低上做出很大奉献。

在已发布的70余个Case 文章中,我们可以看到各种传统监控平台的性能症结被解决,数字化、聪明化转型变得更顺畅,一部分案例如下:

① 顺丰科技:依据容量规划完成相关参数调整后,在理想情状下,TDengine 集群写进速度最高达到90w条/s的写进速度。服务端物理机由 21 台降至 3 台,每日所需存储空间为 93G(2副本),同等副本下仅为 OpenTSDB+HBase 的约 1/10。

② 零跑科技:不用再像 MongoDB 一样,在查询前还需要依据业务加工出需求数据,TDengine 的列式存储,直接以 SQL 计算即可,大大提高了业务的灵巧性,同时其高压缩算法提升了 10 到 20 倍的压缩性能。

③ 跨越速运:使用TDengine后服务器数量从 21 台降至 3 台,压缩一个 5 万行、每行在 600 字节以上的表,压缩后的磁盘 size 是 1665KB,压缩率高达 1%。

④ 浙商银行:目前微服务可视化服务治理平台对并发要求较高,但是 TDengine 可以很好地称心需求,插进/查询平均耗时均在 10ms 以内。

⑤ 同花顺:在稳定性上,改造前调用数据情状共40W次,共出现反常0.01%的反常,使用TDengine改造后出现反常降低至0.001%。

⑥ 得物:在批量写进设置上设置最大写进条数,耗时基本也能保持在毫秒。目前 Sentinel 的数据没有使用副本,全量数据分散在三台机器中,依据计算得知 TDengine 对于 Sentinel 监控数据的压缩率达 10%,相当可看。

⑦ 货拉拉:将监控的数据存储由 MySQL 改造为 TDengine 后,不仅顶住了监控数据增长所带来的压力,还节约了存储空间,成本压缩到了原来的 1/10 甚至更低。历史原生监控数据可回溯时间也变得更长,之前存储 3 天原生数据及聚合数据的空间,现在可供原始数据存储 45 天。

技术能力阐明

1、高性能时序数据库

足够利用时序数据的特征,通过创新的存储引擎设计,无论是数据写进还是查询,TDengine 时序数据库的性能比通用数据库快 10 倍以上,也远超其他时序数据库,存储空间不及通用数据库的 1/10。

2、云原生时序数据库

通过原生分布式的设计,足够利用云平台的优势,TDengine 时序数据库提供了水平扩展能力,具备弹性、韧性和可看测性,支持 Kubernetes 部署,可运行在公有云、私有云和混合云上。

3、开源的时序数据库

TDengine 的研发始于 2016 年 12 月。经过 2 年多的研发后,TDengine 团队在 2019 年 7 月将单机版开源,2020 年 8 月又将集群版开源。2022年 8 月,TDengine 发布 3.0 版本,成为一款真正的云原生时序数据库。

TDengine 项目十分活跃,到目前为止,TDengine 项目在 GitHub 上总共收成了 20.3k star,全球安装实例数已经超过 183.7k,用户遍布全球五十多个国家和地区。

TDengine 全球运行实例分布图

4、强大的数据分析能力

TDengine 是支持 SQL 的时序数据库,对于数据分析师而言,使用 TDengine 就像在使用一个关系型数据库。而且通过超级表、存储和计算分别、数据按时间分区、估量算等多种手段,TDengine 提供了强大而又简单易用的分析能力。

5、简单易用的时序数据库

TDengine 作为一款时序数据库(Time Series Database),为时序数据的处理提供了一强大而又简单易用的平台。一个数据摘集点一张表、超级表和标签的核心设计使得写进和查询的性能极大提升,而且让组织和查找数据变得更加简单。对于数据库治理员来说,TDengine 显著减少了系统部署保护和治理数据的工作量。对于开发人员来说,TDengine 提供了简单的接口、极简的解决方案,并支持与众多第三方工具的无缝集成。对于数据用户说,TDengine 提供了便利的获取数据的方式。

6、支持 SQL 并对时序数据处理进行扩展

众多的时序数据库(Time Series Database)以及传统的实时数据库(Real Time Database),都摘用自己的查询语言,有的甚至只能使用 API 来做查询。TDengine Database 从诞生的第一天起,就摘用 SQL 做为自己的查询语言,因为 TDengine 团队认为 SQL 是世界上最简单易用、最时髦的查询语言,为众多程序员所喜爱,这样能够降低学习门槛和使用程序迁移成本。同时,为方便大家对时序数据进行分析处理,TDengine Database 对准则 SQL 进行了扩展。

近年营收及未来预期

涛思数据在产品研发上市的第二年开始,销售额已突破千万,近几年营收均以每年3至5倍的速度增长,且值得关注的是,2022年开始启动美国为首的北美市场,已经开始收成客户。

依据 IDC 发布的 2022年版《全球物联网支出指南》(IDC Worldwide Internet of Things Spending Guide)提供的最新推测数据,2021年全球物联网(企业级)支出规模达6,902.6亿美元,并有看在2026年达到1.1万亿美元,五年(2022-2026)复合增长率(CAGR)10.7%。其中,中国企业级市场规模将在2026年达到2,940亿美元,复合增长率(CAGR)13.2%。全球占比约为25.7%,陆续保持全球最大物联网市场体量。涛思数据期看成为时序数据库的事实准则,逐步增加在行业内的占比。

企业负责人

·陶建辉 TDengine创始人·核心研发

1986年考进中国科大,1994年到美国印第安纳大学攻读天体物理博士,曾在美国芝加哥Motorola、3Com等公司从事无线互联网的研发工作,在高可靠分布式系统、即时通信、消息队列等方面,是顶尖的技术专家。2008年回到北京创办和信,专注移动互联网IP Push和IP实时消息服务,2010年和信被台湾联发科收购。2013年再度创业,创办快乐妈咪,专注母婴智能硬件和母婴健康服务,2016年初快乐妈咪被太平洋网络收购。2017年5月又再次走向战场,创办涛思数据,专注时序空间数据的实时高效的处理,其自主研发的产品物联网大数据平台TDengine比其他业内标杆性能好10倍以上,可广泛运用于物联网、车联网、工业大数据等领域。

融资情状

已获得合计近 7000万美元融资。

• 2020年1月获GGV纪源资本,红杉中国种子基金、永辉瑞金的Pre-A投资。

• 2020年4月获红杉资本中国基金、GGV纪源资本的A轮投资。

• 2021年5月获得经纬中国、红杉资本中国基金、GGV纪源资本、指数资本的4700万美元的B轮融资。

投资人评判

中国在物联网领域有全球领先的技术累计和设备链接数量,而且还在快速增长。涛思数据作为专门使用于物联网场景的时序数据库,可以大幅提升存储、查询、分析和计算效率,让物联网使用开发更便利。我们看好涛思数据在开源社区继续扩展影响力,赋能更多开发者。GGV也会继续支持公司的发展,成为具有全球影响力的中国基础软件公司。

——GGV纪源资本治理合伙人 符绩勋

随着消费、能源、工业、聪明城市等多个领域物联网使用的快速渗透,物联网的接进设备数和数据量在高速增长。涛思数据瞄准日益增长的物联网大数据市场,产品定位精准,在物联网市场形成了强竞争力。其核心产品TDengine,通过开源方式获得开源社区的大量正向反馈,得以继续快速迭代。开源的影响力也带来了付费用户数量的快速增长。信赖B轮融资后,涛思数据能够陆续扩展在物联网大数据领域的优势,将TDengine打造成全球领先的物联网IoT数据处理平台。

——红杉资本中国基金投资合伙人 吴茗

客户评判

具体到实际业务中,TDengine 表现出了优异的性能。以存储性能为例,之前我们使用 ES集群时,15个节点只能支持3个月的数据存储,在接进 TDengine 之后,7 个同样配置的集群,已经支撑了 5 个月的数据存储。基于 TDengine 在当下业务中所表现出的优异成果,我们在未来考虑向 TDengine 中接进更大规模的轨迹数据以及其他业务中的时序数据。也期看未来我们能借力 TDengine,实现大量的轨迹计算及挖掘,将公司内部的数据实现快速变现,加速充电桩业务的发展,依靠 LBS 扶助客户挖掘更多的潜在客户,实现多边共赢。

——四维图新位置服务部门数据平台负责人 曹志强

在存储方面,在使用 TDengine 之后,针对生产环境的一个 6.6TB 的集群,我们粗略估量了一下前后的压缩比,可能在 6.6/0.4。

在我们原来的集群中是没有副本的,单纯就部署了 MySQL 的 5 个分库,使用了 4C 8GB 2TB 的 5 台机器,在使用 TDengine 之后,现在是 8C 32GB 2TB 的 3 台机器。通过 TDengine 我们构建了多副本和统一的能力,以及后续上混合云的能力,这是整个平台级的一个优化与提升。

——OPPO 高级后端工程师 唐恒建

单机版
阿里云复盘“香港Region可用区C发生大规模服务中断”事件 高并发系统设计的 15 个锦囊妙招
相关内容
发表评论

游客 回复需填写必要信息