2023年4月OpenTelemetry终端用户讨论总结

2023年4月,OpenTelemetry终端用户组在亚太地区(APAC)举行了会议。由于KubeCon欧洲,AMER和EMEA的会议没有举行;然而,在5月份,我们将再次举行3个地区的会议。

讨论采用精益咖啡 (Lean Coffee) 格式,参与者被邀请在像这篇文章一样的Agile Coffee讨论板块上发布他们的话题,并且与会者会对他们想要讨论的话题进行投票。

我们讨论了什么

我们讨论了在大型组织中推广OpenTelemetry的采用,并讨论了如何在规模上优化可观察性数据。

讨论亮点

以下是本月讨论的摘要。

注:回答是由OTel社区成员和终端用户根据他们的知识提供的。这些回答不是OpenTelemetry的官方推荐。

在大型组织中推广OpenTelemetry的采用

**问:**在大型组织中,您如何推广OpenTelemetry的采用?

**答:**在大型组织中,第一步是向领导层介绍可观察性的当前痛点。拥有一个开源的可观察性标准是有益的。如果没有统一的标准,跨不同团队之间的沟通将非常困难。如果使用OpenTelemetry,您就不需要依赖任何供应商代理,而且可以灵活地将数据发送到多个后端。

如何在规模上优化可观察性数据?

**问:**在大型组织中,可观察性数据可能高达每天的TB级别,这将带来相关的成本。但人们始终觉得捕获到的数据中有80%是无用的。没有供应商能帮助您了解哪些数据被访问以及如何将该可视性传达给发送数据的工程团队。

**答:**在规模上优化可观察性的方法之一是采样。以下是有关使用OpenTelemetry进行尾采样的文章:Tail Sampling with OpenTelemetry。在SDK和收集器级别,您有很多选项可以减少数据量。

此外,OpenTelemetry收集器方面正在积极进行处理更高效的大规模数据的工作。例如,有关使用Apache Arrow进行序列化以优化网络成本的工作正在进行中。

在规模上优化可观察性数据的另一种方法是决定您希望存储多少数据供将来使用。您应该优化数据存储,以减少成本。

其他重要讨论点

OpenTelemetry的成熟度模型

**问:**是否有一些文献可供了解在组织中达到特定成熟度水平的步骤?例如,我应该能够去找一个团队告诉他们从X开始,然后做Y来进一步发展。在大型企业中,您必须为人们提供一些了解OpenTelemetry成熟度的东西。

**答:**对于采用OpenTelemetry的团队,一个好主意是从一些最小的变化开始。例如,团队可以从具有自动化注入支持的编程语言开始。从小的变化中看到价值可以在团队中建立更多的信心,以深入探索OpenTelemetry的采用。

还有几个可用的OpenTelemetry接收器。这些接收器有助于收集终端用户已经拥有的遥测数据。例如,Prometheus接收器可以帮助您以Prometheus格式接收指标数据。使用这些接收器,您可以从应用程序的不同组件中开始发送遥测数据。

会议记录和录像

深入了解以上讨论的更多内容,请查看以下内容:

加入我们!

如果您有关于如何在您的组织中使用OpenTelemetry的故事要分享,我们很乐意收到您的分享!分享的方法:

记得在MastodonTwitter上关注OpenTelemetry,并使用**#OpenTelemetry**标签分享您的故事!