从我第一次接触InfluxDB 3.0到现在已经有好几年的时间了。我很早就开始使用它,以至于DataFusion的一个上游开发人员直接称我为“User0”。一个我私下里并不引以为傲的绰号现在,经过这些年的开发,我真的很高兴能在InfluxData团队的工作中扮演一个小角色,以及更广泛的Apache Arrow社区与世界分享,因为我们推出了InfluxDB 3.0,我真诚地希望现有和新用户都能发现这个版本非常有用。
到今天为止,InfluxDB 3.0现在是所有InfluxDB产品的基础,无论是当前还是未来,它首次为InfluxDB平台带来了高性能,无限基数,SQL支持和低成本对象存储。InfluxDB 3.0在Rust中作为一个列式数据库开发,在单个数据存储中引入了对全系列时间序列数据(指标,事件和跟踪)的支持,以支持依赖于高基数时间序列数据的可观察性,实时分析和IoT/IIoT的用例。
InfluxDB 3.0现已在InfluxData的云产品中提供:InfluxDB Cloud Serverless(我们的完全托管,弹性,多租户数据库)和InfluxDB Cloud Dedicated(InfluxDB的完全托管,单租户版本)今天宣布。请继续关注今年晚些时候推出的两款计划中的自我管理产品:
InfluxDB 3.0集群:InfluxDB Enterprise的发展。
InfluxDB 3.0 Edge:用于本地和边缘部署的单节点实例将于今年晚些时候推出。
InfluxDB 3.0 diagram
InfluxDB Cloud Dedicated是处理大型数据集的客户的理想解决方案,他们需要在专用的单租户集群中隔离数据的保证和安全性。它提供自定义配置和增强的安全选项(包括企业SSO、专用连接和基于角色的访问控制)以及基于容量的定价模型。
优化InfluxDB 3.0以...
如果您属于以下类别之一,我们认为您应该查看InfluxDB 3.0:
您是现有的InfluxDB OSS用户- InfluxDB 3.0可能会以最小的更改更快,更便宜地运行您现有的工作负载。此外,它还允许您访问新功能,并能够使用InfluxDB处理更多不同类型的数据。
您不是现有的InfluxDB用户,但您需要一个具有大量数据实时功能的分析数据库,或者您正在努力从现有的分析数据库中获得最大价值,那么InfluxDB 3.0将满足您的需求。
InfluxDB 3.0在一些重要方面超越了InfluxDB 1.x和2.x。InfluxDB 3.0的增强功能将InfluxDB带到了分析数据库的最前沿,允许开发人员实时大规模地摄取和查询所有类型的全保真度时间序列数据。
InfluxDB 3.0现在支持无限基数,这将InfluxDB的用例扩展到任何时间戳数据。与其他分析数据库不同,InfluxDB 3.0在摄取性能、可扩展性、弹性和效率方面都有巨大的提升,即使数据复杂性和基数增加。
例如,与以前版本的InfluxDB相比,新的InfluxDB 3.0在以下方面提供了性能提升:
对高基数数据的查询速度提高100倍,提供实时查询响应
10倍的摄取性能,每秒可摄取、存储和分析数十亿个时间序列数据点,无任何限制或上限
通过使用Apache Parquet文件格式,数据压缩能力提高了10倍,该文件格式专为高效的数据存储和检索而设计
我们围绕Apache Arrow项目开发了InfluxDB IOx,并扩展为InfluxDB 3.0,这是一个开源的内存中列式数据规范,它是分析用例高性能计算的黄金标准。我们在Arrow上构建了InfluxDB IOx引擎,以利用其性能和生态系统。
InfluxDB 3.0现在使用Apache Parquet文件格式来存储数据。Parquet的压缩在有效利用磁盘空间方面实现了数量级的增益。在更少的空间中存储更多数据的能力对于控制成本以及大型分析工作负载的整体效率非常重要。
利用Apache DataFusion,InfluxDB 3.0具有现代化和超快的SQL实现。由于它基于开放标准,因此您可以将现有的SQL知识和工具带入InfluxDB体验。我们甚至增强了DataFusion的SQL方言,以包括关键的时间序列函数。
我们还将InfluxData的时间序列查询语言InfluxQL引入了DataFusion。现在,InfluxQL运行速度比以往任何时候都快。
在InfluxData,我们相信Apache Arrow生态系统。秉承我们的开源精神,我们的工程师为上游Arrow项目做出了重大贡献,以确保性能和功能符合InfluxDB及其专用用户群的标准。InfluxDB 3.0的引入首次将时间序列数据引入Arrow生态系统,使分析工作负载能够更轻松地整合时间序列数据。这确保OSS贡献更容易构建和集成。