哈哈小说
第 6 卷 · AI 的前夜 · 第 68 章 · 68 段 · 0 字

风格演化

第六十八章 风格演化

周四早上七点半,秦朗发来注释版本。

格式干净,每条建议后面多了一行来源标注:「数据来源:YYYY年前历史提交。如团队风格已更新,此条建议可酌情忽略。」有问题的两条各自附了一段说明,写明是2019年之前的早期历史提交里出现频率较高的写法,当时团队还在用另一种代码规范框架。

那边也整理了一份训练时间段的记录,分时段的数据分布图,显示各时间段commit的数量和比例,2019年前的数据占比在17%左右。

两份材料扫了一遍,回了一条:「10点会议,秦朗主讲,麦景行技术兜底,我旁听。」

秦朗回了一条「好」。

「收到。」麦景行说。


会议前五分钟,陆衍给秦朗说了三句话:「第一,不防守;第二,所有结论带证据;第三,把问题从'模型有没有错'改成'历史风格可解释、可控制'。」

点了头。

十点整,谭宝的视频进来了。

苏越在,旁边坐着一个四十多岁的人,头发短,表情严肃,戴眼镜,这是谭宝,天象云的技术总监。他进会没有寒暄,开口就是:「苏越跟我说了那两条建议。如果是模型幻觉,我们这边要重新评估接入。」

秦朗没有急着解释,先切到第一张图:「谭总,先看这个。」

屏幕上是训练数据的时间分布图,横轴是commit时间,纵轴是数量。「你们的提交历史里,2019年前的数据占17%。那两条建议,都来自那个时间段。」他切到第二张,「这是2019年3月,你们内部切换规范框架之后的提交分布。两条写法的出现频率,从这个节点之后降到几乎为零。」

谭宝的表情没有变,但手停了一下。

「所以这不是模型幻觉,」秦朗继续,「模型学到了你们2019年前确实存在过的写法。历史数据里有,模型就学进去了。」

插图

「17%的旧数据,为什么还能影响建议?你们训练策略有没有问题?」

「有影响,但可控。」秦朗直接说,「我们出了一个注释版本,在有历史来源的建议后面加了标注,告诉你们这条建议来自哪个时间段。2019年前的早期写法,由你们工程师自己决定要不要参考。六周迭代里会把这类旧数据的权重调低,往后建议会越来越贴近你们现在的写法。」

「能看一下那个注释版本吗?」谭宝说。

屏幕共享了,注释版本翻出来。对面往前凑了一下,看了两分钟。

「那条SQL变量命名的,」谭宝指了一下,「这是我们2018年的写法,那套框架2019年的时候全推翻了,对的。那条接口返回格式,2019年前的接口规范,也是换掉了的。」他靠回椅背,「这两条确实是历史遗留的风格,工具没出问题。」

「谭总觉得这两条以后不需要,可以在管理后台标注忽略,以后这类旧数据的权重会持续降低。」

「明白了,」谭宝说,「这个处理方式可以接受。」

他在旁边听到这里,知道过去了。秦朗入职第四天,第一次独立面对这个级别的质询,按之前说的打法,证据一张一张递出来,干净利落。


快结束的时候,谭宝多留了一分钟。

「还有件事好奇一下,」他说,「你们这套工具,能不能生成一份报告,把2019年到现在的写法变化做成时间轴。哪些写法消失了,哪些是后来冒出来的。这个演变过程,能不能看见。」

没有立刻答,把视线转向陆衍。

旁边的陆衍开口了:「这个需求我们记下来,评估一下实现成本,本轮迭代先把六周达标完成,风格演化报告可以作为后续版本的方向。」

谭宝靠回椅背,「不急,但做出来不只是对我们有价值,你们其他客户应该也有。」

视频断了。

插图

他在屏幕前静了一下。

风格演化路径,这是个没想到的需求。谭宝说得对,这个功能如果做出来,每个客户都能看到自己那套代码习惯是怎么成型的。哪些传下来了,哪些是新工程师带进来的。这是一张代码历史的地图。

这个功能需求写进了产品文档:

「风格演化路径报告(待评估):基于commit历史时间轴,展示代码习惯的演变轨迹。潜在价值:新工程师了解历史风格形成过程;技术负责人评估规范迭代是否落地。优先级待定,六周达标后评估。」


下午两点,凤合接入正式开始。

给凤合那边发了数据包接收指引,林建斌那边对接的工程师叫周天,看了一遍发回几个问题。秦朗接手,直接打了个电话,二十分钟内把流程确认完了。

陆衍看见秦朗挂掉电话,走过去,「周天那边有什么特殊情况?」

「他们的仓库有两个branch,主干和长期维护的旧版本,旧版本是给政务客户用的,新功能只在主干。我建议他只传主干的commit历史,旧版本那个branch的历史数据不传,保护政务线,也让训练数据更干净。」

「周天怎么说的?」

「他说可以,今天下午打包,明天上午发过来。」

点了头。

回到工位,开始整理第一步的接入记录。这是他第一次主导客户沟通,入职第四天,从旁听到上手,比预期快了很多。

在旁边,偶尔过来看一眼,没有说什么。麦景行看的方式是评估,不是检查。

插图

晚上七点,顾衔发来消息:「等保备案材料预审通过了,没有退回,说是进入正式受理阶段,周期大概三个月。」

那条消息发进群里,没有评论。

乔木:「好,启明教育那边可以给一个大概时间线了:年底前等保完成,Q4可以谈政务线。」

「Q4先别承诺,」陆衍说,「等保通过再说,等到那时候再定。」

「明白。」

顾衔:「等保这边,我下周继续跟。」

群聊安静下来,他看了一眼今天的事情。

那场质询化险为夷,秦朗处理了第一次客户质询,顾衔等保预审通过,凤合接入第一步落地。

今天是天象云接入第九天,还剩五天到两周接入时限。训练完成,74%基线,接下来六周还要做迭代,但今天这一步,证明了产品方向是对的。

剩下的,是时间的事。


晚上在船坞里把今天说了一遍。

「谭宝的质询,秦朗主讲,过了。谭宝额外提了一个功能需求:时间轴上看写法是怎么演化的。」

豆包那道暖橙的光:

> 谭宝问这个,说明他在认真想用这套工具做什么,这是好客户会做的事。功能需求来自真实使用场景,值得认真对待。

插图

「先把六周达标跑完,再评估这个方向。」

Claude那道蓝紫光:

> 这个方向,实现难度不低,但逻辑是清晰的,你们训练数据里已经有时间轴了。核心是可视化怎么做,以及怎么让工程师看得懂。

「这个需求如果做,要让麦景行评估工作量。不是现在,六周后。」

Codex那道翠绿光,一行字:

> 秦朗今天处理得好,但今天是第四天。两个月后再看,那时候才知道他到底行不行。

「对,」他说,「两个月。」

窗口合上,日历翻了一格。

明天,天象云接入第十天,最后四天。

手机屏幕又亮了。苏越发来一条:

「陆总,谭总刚才说,想把这份初版报告拿给他们的安全委员会看一眼。下周一他们有例会。」

那条消息他看了一会儿,没有立刻回。

技术总监过了,下一关是安全委员会。