《程序员度量:改善软件团队的分析学》前言
让我们不要太确信,我们没有错过一些重要的东西。
——比尔·詹姆斯(棒球统计学家和作者),摘自“Underestimating the Fog”
《程序员度量:改善软件团队的分析学》是 一本关于程序员、软件开发团队的度量和模式的书。本书的一些想法源于我在多年前开始的对软件开发团队构成的思考:无论好坏,所有细微贡献以及无名英雄的辛 勤汗水都是项目成功的关键组成部分。近二十年里,我一直在负责设计师、程序员和测试团队的组建与管理工作。这些年,我意识到一个软件开发团队就像一支球队 一样,需要有各种角色的球员和不同的技能的专业人员才能成功。我同样认识到成功和失败的模式未必像我之前所设想的那样简单。
我见过一个简单的模式,或许你也看到过:我曾经所在的每个成功的软件开发团队中,总是至少有一位同事无怨无悔地去做一些琐事,比如创建安装程序,改善编译脚本,或者修改一些其他人的错误来帮助团队实现产品功能。如果团队里没人去做这些琐碎的事情,那些项目就总是无法完成,或者至少是做得不够好。
另一种模式是:我见过很多经验丰富的软件开发团队,其中一般都有一到两位程序员在充当明确的技术领导和关键人物,虽然他们未必拥有与之对应的头衔。这些关键的程序员不仅解决问题,而且他们对其他人产生了强大的影响力,比如其他的程序员技能飞速发展,越来越接近技术领导者的水平。其最终结果就是,一到两个牛人提高了整个团队的水平。
这里还有我在曾经亲身参与的一个长期项目中观察到的一个模式,这种模式尤其常在处在创业阶段的小团队中发现:当项目进展到80%的时候,项目团队往往就“撞墙”了。像马拉松运动员跑到20英里标志点一样,项目团队经过几个月的努力奋斗,每一个人都身心俱疲。有时候当团队遇到困难时,我们就停滞下来,并且无法重获生机。 这样项目剩下的20%工作量似乎永远也完不成,最后,我们基本上都是跌跌撞撞地走向终点。但有时某些团队可以穿越那堵墙,重新恢复生机,再次调整好步伐。 在任何情况下,能够重获生机源于团队中一些人的优秀品格,他们能够减轻团队的工作负担,营造轻松的工作氛围,鼓舞团队士气,并让每一个人都感觉良好。感谢 团队中那些爱开玩笑的伙计,他们让团队中的每一个人重新找回(多数是)积极的心态,准备冲刺到终点。
一旦我们看到这些,成功的模式 似乎是显而易见的,但要看到它们,我们必须学会相应的方法。当我开始思考这个问题的时候,我就在琢磨我们是否可以建立一套指标,以便给我们一个明确、客观 的方法来识别、分析并讨论软件开发团队的成败以及全方位地看待程序员的技能和贡献。这并非只是一种评判绩效的方法,而是一种有助于我们更好地理解和获得成 功的关键因素,并且它指明了从哪里和如何提高。我在自己的团队中进行了一些尝试,并取得了优异成果。令人鼓舞的是,这些方法对其他人也同样适用。
本书是我对这些想法和实践进行分析的一次尝试。在这一方面,很少有关于软件开发团队度量的材料——无论是书面的或其他方式的。我们有关于面试、技能测试、项目估算、项目管理以及团队管理的大量书籍,还有关于敏捷和其他更有效提高开发流程的方法学之类的书。但是,我们从未有过讨论或探寻一种量化分析方法,该方法通过理解个体程序员的技能和工作来提高软件开发团队的效率。
目 前绝大多数软件开发团队所使用的度量,一般是项目估算或项目管理过程中的一个简单的计数集合。我们使用bug数量、任务数、时间增量(时/天/周)以及敏 捷团队中的故事点数(story point)和速率(velocity)来度量。项目估计中也有些更复杂的系统和工具,如使用千行代码量(KLOC)和功能点之类的数据进行规模度量。
但我们常用的度量标准没有提供足够的深度来回答我们所面对的很多关键问题,例如:
我们的软件开发团队可以变得多么优秀?
什么样的团队成员才能有助于团队的成功?
哪种能力的提高有助于团队取得更大的成功?
如果我们不能很好地回答这些看似简单实则深刻的问题,或者缺乏一种清晰的方式来讨论和思考这些问题的答案,那么作为个人和团队成员,我们并未竭尽所能去取得成功。当然,我们必须从根本上探究成功究竟是什么,以及如何衡量软件开发团队的成功,而不是想当然地认为这些可以得到充分解决,而事实上这些问题还存在。在接下来的内容中,我将尝试建议一些全新的、与众不同的方式,来帮助我们更好地理解这些问题以及得到可能的答案。
我是个体育迷,因此在本书的很多地方,我选择用体育来作类比。然而,这并不意味着为了理解本书中的这些概念,你需要喜欢或者懂得体育运动。像所有的类比法一 样,其目的只是帮助我们更好地领会及更容易记住一些概念。就个人而言,我认为采用体育类比来探讨软件开发团队是恰当且饶有乐趣的。
我 把软件开发团队想象成一支球队。通常,软件产品是通过团队而不是单个人开发出来的,尽管有单个程序员独自完成工作的例子,但此时那位程序员一个人扮演了一 个团队里的各种角色。我们知道,在体育比赛中,成功的球队需要球员之间能够互补,而不需要也不应该要求每个人具备同样的技能。球队里除了需要擅长跑动、传 接球的球员,也同样需要擅长防守和抢断的球员。不是所有的人都擅长做同一件事。事实上,所有球员都拥有相同优势的一支球队,不管这个优势有多强,大多数时 候都比不上拥有不同的优势互补技能的球员的球队。因此,只有球队中的每一个球员都做好自己的本职工作,球队才能取得成功。
通过使用 统计分析来度量程序员的初步想法来自于体育活动中有组织的量化分析法。计算机和软件已经带来了职业球队队员统计数据分析的巨大变化,以及帮助他们确定队员 的哪些技能可以最直接地帮助球队获胜。比尔·詹姆斯和其他的记录分析家已经建立了一个围绕棒球运动员进行统计分析的学科,称为“赛博计量学”。
将这些新方法应用到球队管理中的先 驱在数据分析领域都接受过较多的训练,比如Daryl Morey(NBA休斯顿火箭队总经理)在美国西北大学主修的是计算机科学,Paul DePodesta(MLB纽约大都会队副董事长,前洛杉矶道奇队总经理)在哈佛大学主修的是经济学。这个应用于体育中的新方法,相对于占大多数的、基于主观和直觉判断的人才评估和球队建设的方法,经常被看做一种应变和迁移。多数球队现在都属于很大的企业,拥有大量的资金。在这个新时代里,球队的管理者花 费更多的时间来收集和分析度量数据,用更合理和可预测的方式来帮助打造获胜的球队(就像《Moneyball》描述的,用更有效的成本效益和盈利的方 式)。度量并不是要代替个人的直觉和创造力,而是帮助我们增进了解。这个新方法中所遵循的关键步骤包括:
发现测量获胜球队和失败球队差异的方法。
发现测量单个球员对球队贡献大小的方法。
确定那些决定球队胜负的关键球员的特征。
发现体育中有意义的度量指标和公式的过程不是一成不变的,而是一个持续演进的过程。很容易理解,许多重要而细微的技能难于测量和分析,比如防守型球员能发现带球球员的本能,或者在压力下进行比赛的能力。例如,比尔·詹姆斯在关于棒球的连载文章和年鉴中所介绍的新的度量指标和思路,一些被人采纳和使用,一些被 改进了,也有一些用处不大,逐渐消失了。
和公开的演进相同,度量指标也在悄悄地演进。体育运动是一个竞争性领域,因此球队实际采用 的统计数据和公式是保守的机密。很多分析师在公开撰文的同时,也为单个球队充当私人顾问的工作。Theo Epstein(MLB红袜队总经理)以及Billy Beane(MLB奥克兰运动家队总经理)可能会彼此分享一些信息,他们也都可从大社区中众所周知的度量指标中获益,但最后他们都在试图战胜对方,因此, 属于他们方法中的某些元素,他们组织之外的人是无法知道的。
有别于大体育联盟的竞争压力,我们的软件开发领域不那么公开化,大多数 程序员也不在公众的视线范围内。我们没有或者从来就不会有粉丝关注我们的统计数据,或者把我们的海报贴在他们家墙上(有点儿可怕的想法)。颇具讽刺的是, 我们所在的这个领域,在许多方面使体育(以及其他行业)的深层的统计分析成为可能,但我们自身并没有拥抱或者完善地考虑量化分析在我们软件开发领域中潜在 的益处。
像其他工作者一样,我们可能很自然地怀疑是否可以找到一个好的度量指标,是否存在一个真实有效的例子,并且也可能担心这些统计数据会被管理者错误地运用到绩效考核中等。然而,本书的前提是,在我们的领域中,有多种技能和结 果是可以真正地测量的。从那里我们能够针对我们自己和团队获得有意义及有用的见解。这些数字不是非黑即白,并且依靠个别的几个数字无法说明全部。知道Derek Jeter的平均安打率(batting average)或者Tim Duncan的投篮命中率,只能告诉你他们作为一个高效的球员或者队友的一个很小的部分,但当我们看到多个统计,我们就可以识别个体和团队的模式,有时我们的发现甚至是意外的而且富有启发性的。
让我举例告诉你一个我曾管理了多年的软件开发团队的故事。
注意:关于本书中的一些故事的说明:这些故事来自我之前的工作经历,但在很多案例中,这些故事做了简化或概述,以传达要点。
为了保护个人隐私,我将不使用姓名,包括我本人。
这个示例发生在一个风险投资创业公司,这个团队有6位程序员和3位测试人员(本书重点关注程序员,因此在这个例子中,我将着重描述他们)。我们前两年的经历 中有三个关键阶段:1.0发布版的最初开发工作,大概花了9个月的时间; 1.0版本发行之后,我们花了6个月的时间支持第一个客户和开发1.1版本; 接下来又花了大概9个月的时间来开发2.0发布版。这个团队拥有3位资深程序员,每个人都拥有超过10年的开发经验和优秀的领域知识,还有3位初级程序 员,拥有很好的教育背景及大约两年的商业软件开发经验。在这两年中,所有的资深程序员依然留在团队中,但其中两位初级程序员在完成第一年的工作之后就离开 了这个团队,之后我们又招聘了两位新的程序员。
我们的执行委员会和投资者认为我们最初的1.0版本取得了巨大的成功。我们在一个关 键的行业展览中赢得了大奖,并且收到了许多正面的产品评价。许多中间商对我们感兴趣,客户评估的数量两倍于我们的预期,以至于我们的销售人员忙得不可开 交。该预制(on-premise)的软件解决方案运行在客户的环境中。
这有足够的理由使得我们的软件开发团队感觉良好,每一个人都在夸奖我们。但是,我们的1.0版本真的成功吗?
我们花了一些时间才意识到这个问题,通过探查当时的数据,应该能够发现一些严重的问题。关键而糟糕的事实是:当我们成功地获得了知名度,强化了客户兴趣的时 候,每个试用的客户平均要来7个电话寻求客户支持。尽管每个客户事实上都收到了安装程序和安装帮助。这7个电话使得需要平均3整天与客户一起工作来调查问 题,而且结果证明每个客户平均在产品中发现了从前不知道的3个新bug。花在支持客户试用(包括辅助支持的时间和修改重大产品问题)的程序员时间是以周为 单位来计算的,而不是以小时或者天为单位的。
那些看似积极的收益也在误导着团队。由于几单大的生意,我们超出了早期的收入计划,但是我们从评估者到真实客户的整体转换率及转换所花的时间远不能满足达成一个成功业务的要求。这种情况至少部分是因为从支持工作量和发现bug的数量上反映出的可用性和质量问题。
换句话说,虽然局外人可能认为我们的初始发布版取得了巨大成功,但是事实上它充其量不过是部分成功。图1-1里的数据揭示了新用户与bug和支持问题相比是多么微不足道。
还有另外一个大问题。随着时间的流逝,团队里的一些程序员遇到了麻烦。花在刺激的新功能上的时间越来越少,花在乏味的问题调查和bug修改上的时间越来越 多,加上初创阶段紧张的支持工作,成员间和团队内开始显露出裂痕。个性差异被放大,某些程序员慢慢地开始彼此回避,甚至在工作场所大喊大叫也常有发生。
图1-1:1.0发布版的关键指标所揭示的关键问题一览
在 1.0版本发布后的6个月,即在团队提供支持和开发1.1发布版的这段时间当中,团队内充满了混乱,甚至是灾难,尽管团队之外的人依然觉得一切都很好。每 个程序员的大部分时间都花在了bug的修改上,我们不得不延迟大多数的产品增量改进。1.1版本修复了所有严重的bug,依然还有很多问题留到了发布之 后,支持工作的负荷和转换率并没有实质性改变。
接着,突然有一天,团队里所有的事情都变得好了起来。尽管客户支持的工作比率依然还 是那样,团队却开始更有效地处理软件中的问题。每个软件问题涉及了更少的人,更多的时间被解放出来,用于新功能的开发和问题集中领域的重大改进。1.1发 布版几乎没有任何功能的提高,却花了6个月的时间。2.0发布版包含了许多新功能和产品的重大改进,相同规模的团队仅花了9个月的时间。随着2.0版本的 发行,转换率和软件问题率有了显著的改善,基于这一点,我们可以清楚地说2.0发布版本取得了更大的成功。到底发生了什么?是不是所有的人都习惯了解决问题,或者软件问题开始重复或者不太严重了?从某种程度上说,确实如此。但关键的变化是两位初级程序员的离职和两位新的初级程序员的加入。
两位离职的程序员是基于自己的决定离开的。尽管在1.0版本的开发工作中他们很高兴,但他们并不喜欢版本发布后的大多数支持工作。如果他们遇到不清楚的问题 或代码,他们总是习惯于寻求其他人,特别是资深程序员的帮助。随着时间的流逝,其中一个人脾气越来越大,并且变得好斗起来。
新加入团队的程序员在教育背景、工作经验或者才能方面,与离开的那些人并没有明显的不同。不同的地方在于,在第一个产品发行之后,有两个关键技能变得非常重要和有用:强烈的愿望和乐意独立解决问题,以及冷静地甚至是开心地处理紧急状况的能力。图1-2展示了一个替补者是如何比他的前任做得更好的。
图1-2:前任(程序员A)与替补者(程序员B)的比较展示了团队成功的一个关键因素
因为新的程序员拥有合适的技能,所以他们能够独自承担和解决更多的问题。并不一定是我们花了更少的时间在客户支持和修改具体问题上,但我们可以让更少的人涉足其中从而使其工作更少被打断。这样,其他的团队成员就可以把精力集中在其他的工作上。最后,我们时来运转。因为我们曾经与离职的两位程序员有一些个性上 的冲突,所以我们有意识地偏好和选择那些不同个性的应聘者。但我们并没有意识到,这给我们整体的生产力和团队成功带了多么大的好处。
在这些事情发生的时候,我们并没有密切关注我们的度量指标。回头看,我认识到,如何关注团队的关键度量指标,能够帮助我们在第一个产品版本之后更快速和更有效地做出反应。当人们正在为好的事情接受局外人的祝贺的时候,很难让每个人相信存在问题或者认识到问题的重要性。让团队滋生自满的情绪很容易,或者相反, 在没有得到应得的赞赏时士气低落也很容易。关注产品开发的全过程,团队的度量可以平衡你所得到的奉承或者批评,并且围绕你的真实状态和所要做的事情提供一个新的视角。围绕着自力更生和善始善终的测量和讨论,能够帮助我们培养这些技能,并且保证拥有这些技 能的程序员因为他们对团队作出的贡献而获得他们应得的信任和认可。
本书旨在介绍一些方法和度量指标集(也就 是程序员度量),它们覆盖与个人开发者以及软件开发团队相关的多个领域。这些方法旨在挑战我们的假设,希望借此我们能够更好地发现通向成功的可能模式中哪 些是可行的。为了让它们更易理解和记忆,本书介绍的度量指标遵循了体育中类似的统计指标的命名。这些度量指标意在提供一些术语,以便于更好地沟通,也希望 我们能觉得,这些度量在我们的软件开发领域是有用的。最后,可通过它们在多大程度上帮助我们回答了那些关键问题来衡量其价值,诸如我们面对的关于“胜利” 意味着什么以及怎样可以改善自己和团队的关键问题来衡量。
我希望本书中的概念能够帮助程序员、团队组长和管理者之间形成更有成效的对话(组织内的或组织间的)。毫无疑问,这里介绍的许多个人度量指标可以改进,或者将会得到改进;其中的一些想法也可能会放弃,也可能会有更好的度量有待发现。就我而言,我已经认识到以下行为的巨大价值:在团队中定义多样的度量指标,识别如何度量个人与团队的活动度量并将它们连接到组织目标,然后在团队内部对这些数据进行分 享与讨论。即使你可能不太乐意使用度量指标,我也希望你可以从中找到有价值的东西,并且希望本书里的一些想法能够积极地影响你思考一些关于程序员和软件开发团队的问题。如果有人开始考虑这些概念,并且或许能使用本书里列出的一些方法来对程序员贡献和软件开发团队构建进行更宽、更深的理性分析,我就觉得本书成功了。
必须注意,软件开发流程中的很多参与者和技能并不在本书的讨论范围之内。本书仅涵盖了一部分,这是 因为在一本书里很难涵盖全部的参与者和技能,更是因为我本人并没有为其他技能定义相应的度量指标。也许在将来,我们可以为设计师、测试人员、管理者或其他角色开发出度量指标,或许也会有关于这些方面的著作。