SQL 是每个分析工程师需要知道的最重要的技能。它是数据从业者的顶级技能中的基础,但经常被忽视。因为它不是什么“新”或“花哨”,所以它被推到了次要位置。但是,为了编写高质量的数据模型,您需要能够编写干净、简洁的 SQL 代码。
SQL 是数据建模的核心。虽然它不是数据建模的唯一方面,但它占了很大一部分。尽管您也可以在不了解 SQL 的情况下编写数据模型,例如使用为您编写 SQL 函数的拖放模型,但大多数分析工程师仍然使用 SQL 来构建他们的数据模型。
编写清晰、简洁的 SQL 代码可以为您的数据模型带来很多好处。一方面,它可以帮助您的模型运行得更快,在优化编写查询时使用更少的计算能力。其次,它可以帮助您拼凑复杂的数据集,计算关键业务指标。第三,如果编写得好,代码可以随着您的业务扩展,从而减少您的技术债务。
虽然您可能认为只了解 SQL 基础知识就能让您走得更远,但您可以了解基础知识并编写糟糕的代码。分析工程师需要不断练习新功能并重写查询以更好地优化它们。数据模型应始终针对可扩展性、运行时间和效率进行优化。为了专注于这三件事,你需要学习编写 DRY 代码。这意味着您必须提前考虑并以可扩展的方式编写 SQL 查询。很有可能,您会遇到一些死胡同,直到找到理想的解决方案。
您的 SQL 代码也需要在编写时考虑到可读性。同样,这需要练习。您需要让自己接受团队成员的代码审查,以便学习编写每个人都能理解的代码。您容易阅读的内容可能对其他人没有意义。每次编写一段代码时,添加注释并进行更改,以便其他人确切地知道代码在做什么。可读性胜过复杂性,始终如此。
最后,作为分析工程师,我们需要计算核心指标并拼凑复杂的数据集。企业依靠我们来解决这些问题并提供他们可以依赖的数据