InfoQ 推荐 ( ) • 2024-04-22 14:30

Tab与空格之争是个延续自Unix时代的问题。

Linus故意“复杂化”Linux Kconfig中的缩进机制

 

长久以来,Linus一直以公开、尖锐提出反馈意见而闻名。尽管自2018年以来他一直在努力控制情绪,但从他最近回复自己强烈反对的提案来看,我们熟悉的那位暴躁老哥又回来了,只是用词文明了许多。这次他针对的,是Tab问题。

 

近日,Linux内核的最新候选版本内核6.9-rc4正式发布,在常见的驱动程序与bug修复部分,不仅对bcachefs进行了更多的调整和优化,还针对最近发现的Spectre式本机分支历史注入数据泄漏问题,提供了有效的缓解措施,以确保系统的稳定性和安全性。

新版本中最引人注目的变化莫过于Linus本人所做出的配置文件变量调整。他针对“Kconfig”进行了优化,主动添加了一些隐藏Tab,将原本的空格缩进改为Tab缩进。这一举措旨在消除那些质量低下的解析器,从而提升整体性能和稳定性。

具体来讲,在下面这段内核源代码中:

default 12 if PAGE_SIZE_4KB default 13 if PAGE_SIZE_8KB default 14 if PAGE_SIZE_16KB default 15 if PAGE_SIZE_32KB default 16 if PAGE_SIZE_64KB default 18 if PAGE_SIZE_256KB

default值与整数值之间的字符现在为八字符宽度的Tab缩进。但由于恰好落在Tab边界的末端,所以其显示成了一个空格字符。

Kconfig是用于控制内核构建系统的配置语言,与许多其他越位规则语言一样,它会使用缩进来分隔各代码块。Linus发现一段特定代码更改commit d96c36004e31,其作用只有一个:修复FTRACE_RECORD_RECURSION_SIZE条目,用空格字符替换Tab符,这能帮助Kconfig解析器正确读取文件。

 

在此更改中,他故意让内核构建配置文件中的缩进机制变得更复杂,以迫使此类解析工具的作者随之改进。Linus的意见是“主动添加一些隐藏的Tab”,这种故意让Tab检测失败的作法已经清晰表达了他的立场。他还写道,“除非必要,否则我不希望多此一举。但现实中的确出现了不少这类愚蠢的工具,所以我只能选择这种方式”。Linus本人对此做出的解释是:我还是觉得应该做出修改。因为如果无法将Tab解析为空格,那些工具就没资格解析内核Kconfig文件。

 

据悉,Linus的隐藏Tab提议出现在Linux内核6.9的第四个候选版本当中。Linus写道,该版本在发布当周“并没有发生什么特别的状况”。

 

值得一提的是,这次Linus并没有态度激烈地“口吐芬芳”,而是故意、甚至可以说是恶意使用更复杂的缩进来恶心那些效果不佳的解析工具。他认为差劲的工具就该被淘汰掉,只有更合适、更强大的工具才能生存……而且这种方式也不会直接伤害任何人的感情。

Tab与空格之争

 

Tab与空格之争是个延续自Unix时代的问题,虽然事情不大,但却永远无法用标准、格式之类的简单方式得到解决。如果真要把问题放大,那可能需要投入无穷无尽的资源和人力。

 

而Linux内核项目一直坚持自己的编码风格,也就是编码圣经《C程序设计语言》的作者Kernighan与Ritchie提出的原则——如果要提交内核代码,最好使用Tab(理想情况下为八字符的Tab,而这种设计又继承自当初的电传打字机与行式打印机)。

 

在现实编程中,缩进使用Tab还是空格的问题不仅在普通程序员中存在争议,很多技术大佬也会参与这项讨论。

 

在接受Reddit采访时,微软创始人比尔·盖茨果断站队了Tab阵营。他表示,“自己更喜欢用Tab,因为我想让column排成一行。对于某些Word文档,我用Tab,如此,当我想要修改部分内容,需要返回并编辑时,Tab显然更容易操作”。

 

而在HBO的喜剧片《硅谷》第三季中,不同的缩进风格甚至导致两位程序员分手。两位程序员一边编程一边约会,男方忍受不了女方使用空格键缩进,认为Tab键更节省文件体积,最终二人不欢而散。

冲突核心

 

编程时需要用缩进来建立视觉层次结构,从而改善代码的结构和可读性。缩进主要用于显示哪些代码行属于条件、循环、方法或者类。除了显示范围之外,缩进还可以用于拆分较长的逻辑操作。包含复杂条件的三元运算符可以用缩进将其表达式拆分成几行,以便开发者加以区分。链式方法调用(如果超过两个)可以在新行上缩进,借此表明它们属于同一操作流。

 

很明显,缩进是一种专门针对人类的工具,目的就是方便开发者阅读和编写代码。每行开头添加的这些空格对于编译器其实没什么实际影响(Python除外)。

 

而围绕Tab符和空格符掀起的争论,其关键并不在于缩进几个字符最合适,而是使用哪种字符更好。

 

Tab符

 

按下键盘上的Tab键就能直接输出Tab符,解析器会将其解释成一定数量的空格,通常是4个或者8个空格符。使用Tab格式的文件通常较小,因为一个Tab符就能代表多个空格,而且现如今处理起来也没什么难度。

 

Tab符的长度在不同IDE和编辑器中的解释各不相同,而且可以配置调整。所以哪怕是希望一个Tab对应6个空格,也完全没有问题。这种可定制性,使得tab符成为不想眼花的开发者们最支持的选项。

 

Tab符发挥的是描述作用,负责告知编辑器应该添加的缩进量。但如果呈现则由代码的阅读者来决定。在Tab派开发者心中,Tab符就是用来缩进的,而空格符专门负责对齐。

 

空格符

 

空格派的主要观点在于一致性。不同平台与编辑器往往有着不同的Tab缩进量。由于其可配置性,我们很难保证自己编写的代码始终能被读取为相同结果。如果我们从某处复制/粘贴来了代码,那么由于缩进量的差异,实际代码可能看起来一团糟。

 

但在任何编辑器和平台上,空格将始终只是空格。不同于Tab符的可配置性,空格在任何位置上的显示效果都一致且稳定。也就是说无论如何设置Tab符,代码都将显示为相同的格式。

 

不同之处在于,这个决定仅由代码编写者做出,而非阅读者做出。空格在代码本身中被固化为一种格式决策,而其他开发者在阅读时无法调整、只能被动接受。

问题的核心不止于技术

 

Tab与空格之争的关键在于该用哪种字符表示缩进。这场争论不止于技术,更是编程理念的体现。

 

换言之,就是缩进方式到底该由谁来指定。

 

Tab符的支持者们认为显示结构应该由阅读者来指定。空格派倡导者则主张应该由编写者指定,毕竟这样更有利于保持一致性。两派都有狂热的支持者,他们各自掌握着充分的论据,但最终如何选择仍然由开发者自己决定。

 

此前,Google程序员Felipe Hoffa 曾分析了GitHub上的40万个代码库,10亿个文件,总共14TB数据,这些文件不包含重复的文件和代码行数低于10行的文件,分析后发现空格键远比Tab键流行。

那么问题来了,你是Tab派还是空格派?

 

参考链接:

https://www.theregister.com/2024/04/16/torvalds_complicates_his_indents/"

https://alexkondov.com/indentation-warfare-tabs-vs-spaces/"