从3c 模型到sc 一致性再到事务内存和评估工具链,hill用了几十年的时间证明了:体系结构不是拿来炫技的地方

上个世纪七十年代末,1979年的时候,ACM联合了IEEE成立了一个奖,专门用来表彰那些在计算机体系结构上持续做贡献的人。这奖当初是为了纪念1947年问世的ENIAC,也就是世界上第一台通用电子计算机,给两位奠基人立的。这个奖的奖金是5000美元。得奖的人很多后来都得了图灵奖,2017年有个叫David Patterson的,算是大满贯了。 到了2019年,这个奖颁给了一个叫Mark D. Hill的人。Hill在存储系统和并行计算这两个领域里是权威级别的人物。上世纪八十年代,他和学生们提出了一个“3C模型”,把缓存失效分成了强制失效、容量失效和冲突失效三种情况。这个模型让大家都能用统一的语言来谈论缓存行为,还催生了好多新的技术,现在大家讲计算机体系结构的时候都绕不过这个概念。 Hill和Sarita Adve一起把顺序一致性模型应用到了DRF场景里,提出了SC for DRF方案。这个方案后来成了Java和C++内存模型的基础,GPU厂商也拿来用了。传统的锁机制在多核处理器上容易让性能变糟,Hill和David Wood就设计了LogTM事务内存系统。这套系统让事务能跨缓存行、跨核心甚至跨节点运行,降低了并发编程的门槛。 并行计算的复杂程度越来越高,评估新的架构就成了个难题。Hill团队弄出了好几个模拟器和工具链,比如Dinero、GEMS还有gem5。这些工具被引用了超过3000次;最近他们又搞出了一个叫BadgerTrap的东西,专门看虚拟内存的行为。 在2017年的ASPLOS大会上,有人问他中国的体系结构研究怎么样。他说中国的研究质量已经从“改进”变成了“有创造性的一流研究”。他还说学术和工业界之间要有界限:大学要搞超前技术,学生可以去实习但别指望带答案回来;遇到专利纠纷时专利诉讼虽然看起来冷酷,但也是提醒对方用了他的点子的最好方式。 Hill提醒后来者别老盯着比工业界优化得好一点点的地方,要去找“转折点”。比如工艺节点变了、应用爆发了、抽象层次提高了都可能是机会。人工智能和云计算正在把指令集推到API层面;能效瓶颈让谷歌用TPU这种新硬件来解决;物联网和AR这些新技术可能会带来新的存储和通信模式。 面对应届生找工作的问题,Hill建议他们自己想清楚十年后想成为什么样的人。如果想赚钱搞高频交易就去干;如果喜欢教书就留着做研究。他也提醒大家别都挤在热门领域里去做“慢牛”研究比较好。 他还建议中国多撒钱到其他学校去,避免只有一两个学校垄断资源。顶尖高校毕业生内部留校也应该禁止一下,这样才能碰撞出火花来。优秀学生出国深造再回流也是好办法。 从3C模型到SC一致性再到事务内存和评估工具链,Hill用了三十多年的时间证明了:体系结构不是拿来炫技的地方而是需要静水流深的“慢功夫”。能效红线、AI洪流、云计算风暴这些转折点就在眼前——千万别让它在沉默中溜走。