第六十八章 风格演化
周四早上七点半,秦朗发来注释版本。
格式干净,每条建议后面多了一行来源标注:「数据来源:YYYY年前历史提交。如团队风格已更新,此条建议可酌情忽略。」有问题的两条各自附了一段说明,写明是2019年之前的早期历史提交里出现频率较高的写法,当时团队还在用另一种代码规范框架。
那边也整理了一份训练时间段的记录,分时段的数据分布图,显示各时间段commit的数量和比例,2019年前的数据占比在17%左右。
两份材料扫了一遍,回了一条:「10点会议,秦朗主讲,麦景行技术兜底,我旁听。」
秦朗回了一条「好」。
「收到。」麦景行说。
会议前五分钟,陆衍给秦朗说了三句话:「第一,不防守;第二,所有结论带证据;第三,把问题从'模型有没有错'改成'历史风格可解释、可控制'。」
点了头。
十点整,谭宝的视频进来了。
苏越在,旁边坐着一个四十多岁的人,头发短,表情严肃,戴眼镜,这是谭宝,天象云的技术总监。他进会没有寒暄,开口就是:「苏越跟我说了那两条建议。如果是模型幻觉,我们这边要重新评估接入。」
秦朗没有急着解释,先切到第一张图:「谭总,先看这个。」
屏幕上是训练数据的时间分布图,横轴是commit时间,纵轴是数量。「你们的提交历史里,2019年前的数据占17%。那两条建议,都来自那个时间段。」他切到第二张,「这是2019年3月,你们内部切换规范框架之后的提交分布。两条写法的出现频率,从这个节点之后降到几乎为零。」
谭宝的表情没有变,但手停了一下。
「所以这不是模型幻觉,」秦朗继续,「模型学到了你们2019年前确实存在过的写法。历史数据里有,模型就学进去了。」

「17%的旧数据,为什么还能影响建议?你们训练策略有没有问题?」
「有影响,但可控。」秦朗直接说,「我们出了一个注释版本,在有历史来源的建议后面加了标注,告诉你们这条建议来自哪个时间段。2019年前的早期写法,由你们工程师自己决定要不要参考。六周迭代里会把这类旧数据的权重调低,往后建议会越来越贴近你们现在的写法。」
「能看一下那个注释版本吗?」谭宝说。
屏幕共享了,注释版本翻出来。对面往前凑了一下,看了两分钟。
「那条SQL变量命名的,」谭宝指了一下,「这是我们2018年的写法,那套框架2019年的时候全推翻了,对的。那条接口返回格式,2019年前的接口规范,也是换掉了的。」他靠回椅背,「这两条确实是历史遗留的风格,工具没出问题。」
「谭总觉得这两条以后不需要,可以在管理后台标注忽略,以后这类旧数据的权重会持续降低。」
「明白了,」谭宝说,「这个处理方式可以接受。」
他在旁边听到这里,知道过去了。秦朗入职第四天,第一次独立面对这个级别的质询,按之前说的打法,证据一张一张递出来,干净利落。
快结束的时候,谭宝多留了一分钟。
「还有件事好奇一下,」他说,「你们这套工具,能不能生成一份报告,把2019年到现在的写法变化做成时间轴。哪些写法消失了,哪些是后来冒出来的。这个演变过程,能不能看见。」
没有立刻答,把视线转向陆衍。
旁边的陆衍开口了:「这个需求我们记下来,评估一下实现成本,本轮迭代先把六周达标完成,风格演化报告可以作为后续版本的方向。」
谭宝靠回椅背,「不急,但做出来不只是对我们有价值,你们其他客户应该也有。」
视频断了。

他在屏幕前静了一下。
风格演化路径,这是个没想到的需求。谭宝说得对,这个功能如果做出来,每个客户都能看到自己那套代码习惯是怎么成型的。哪些传下来了,哪些是新工程师带进来的。这是一张代码历史的地图。
这个功能需求写进了产品文档:
「风格演化路径报告(待评估):基于commit历史时间轴,展示代码习惯的演变轨迹。潜在价值:新工程师了解历史风格形成过程;技术负责人评估规范迭代是否落地。优先级待定,六周达标后评估。」
下午两点,凤合接入正式开始。
给凤合那边发了数据包接收指引,林建斌那边对接的工程师叫周天,看了一遍发回几个问题。秦朗接手,直接打了个电话,二十分钟内把流程确认完了。
陆衍看见秦朗挂掉电话,走过去,「周天那边有什么特殊情况?」
「他们的仓库有两个branch,主干和长期维护的旧版本,旧版本是给政务客户用的,新功能只在主干。我建议他只传主干的commit历史,旧版本那个branch的历史数据不传,保护政务线,也让训练数据更干净。」
「周天怎么说的?」
「他说可以,今天下午打包,明天上午发过来。」
点了头。
回到工位,开始整理第一步的接入记录。这是他第一次主导客户沟通,入职第四天,从旁听到上手,比预期快了很多。
在旁边,偶尔过来看一眼,没有说什么。麦景行看的方式是评估,不是检查。

晚上七点,顾衔发来消息:「等保备案材料预审通过了,没有退回,说是进入正式受理阶段,周期大概三个月。」
那条消息发进群里,没有评论。
乔木:「好,启明教育那边可以给一个大概时间线了:年底前等保完成,Q4可以谈政务线。」
「Q4先别承诺,」陆衍说,「等保通过再说,等到那时候再定。」
「明白。」
顾衔:「等保这边,我下周继续跟。」
群聊安静下来,他看了一眼今天的事情。
那场质询化险为夷,秦朗处理了第一次客户质询,顾衔等保预审通过,凤合接入第一步落地。
今天是天象云接入第九天,还剩五天到两周接入时限。训练完成,74%基线,接下来六周还要做迭代,但今天这一步,证明了产品方向是对的。
剩下的,是时间的事。
晚上在船坞里把今天说了一遍。
「谭宝的质询,秦朗主讲,过了。谭宝额外提了一个功能需求:时间轴上看写法是怎么演化的。」
豆包那道暖橙的光:
> 谭宝问这个,说明他在认真想用这套工具做什么,这是好客户会做的事。功能需求来自真实使用场景,值得认真对待。

「先把六周达标跑完,再评估这个方向。」
Claude那道蓝紫光:
> 这个方向,实现难度不低,但逻辑是清晰的,你们训练数据里已经有时间轴了。核心是可视化怎么做,以及怎么让工程师看得懂。
「这个需求如果做,要让麦景行评估工作量。不是现在,六周后。」
Codex那道翠绿光,一行字:
> 秦朗今天处理得好,但今天是第四天。两个月后再看,那时候才知道他到底行不行。
「对,」他说,「两个月。」
窗口合上,日历翻了一格。
明天,天象云接入第十天,最后四天。
手机屏幕又亮了。苏越发来一条:
「陆总,谭总刚才说,想把这份初版报告拿给他们的安全委员会看一眼。下周一他们有例会。」
那条消息他看了一会儿,没有立刻回。
技术总监过了,下一关是安全委员会。