第四十八章 第一项
那个v0.1文档,月底之后连改了三稿。
第一稿是当天夜里写的,十二页,问题清单居多,技术路线只有框架。第二稿是隔天下午改的,删掉六页,把框架推进到决策。第三稿,是等乔木看完带着反馈回来之后。
"有两处,我觉得方向可以商量,"乔木把自己批注过的打印稿放到桌上,"一是规范匹配的颗粒度,你设的是团队级,我觉得可以先做项目级,更容易测,也更容易收反馈。二是训练数据的冷启动,你说的方案能跑,但第一个月数据量薄,薄到规范层出不了准确结果。"
找到那两处批注,看了一下。"你的项目级,怎么切?"
乔木在桌上铺开一张手写图,用笔比划:"企业有多个项目,每个项目有自己的代码风格,先训练项目级,累积够了再往上归纳成团队级。两步走,第一步快,第二步自然发生。"
"冷启动呢?"
"接入云帆里最活跃的那批企业测试用户,用他们项目的commit历史做数据底座,跳过冷启动。"
拿起那张手写图,翻了翻,放回去。
"用第一种。从今天改。"
麦景行那边,是上午十一点发来的文档链接,打开是一张问题清单,十七条,每条后面跟着预判和建议方向。第一条和乔木刚刚讨论过的颗粒度问题一样,结论相同,但理由不同:
「项目级比团队级采集成本低,数据质量更可控。」
看了一下时间戳:昨晚十一点四十六。乔木来之前一天,他已经把这十七条想完了。
给麦景行回了一条:十七条里,你自己做哪几条?
麦景行很快回:四、七、十三,我来,其他人各一。
改起来。
那天下午,顾衔来敲门。

"林工那边今天签了。"
抬起头。"签了什么?"
"企业版合同,"顾衔说,"基础版,三个月,约束层两周出,他们选了约束层不齐的那个版本,愿意等后续迭代。"
把手里的文件放下。"金额呢?"
"月付,价格是我们估的上限八成,他们接了,没有砍价。"
在那里坐了一会儿,没有说话。
云帆第一个付费企业客户,不是内测免费号,是月付合同,是真实价格,是林工这个技术负责人拍板拿出来的钱。他只看一件事:云帆生成的代码,进不进得了他们的仓库、过不过得了他们的CI。进了,就值这个价。
韦东来这一次没有说什么,只是在群里发了一个字,是顾衔发过来的合同首页截图,陈修在下面发了三个字:"我们赢了。"
麦景行没有回群。但两小时后,他更新了规范层冷启动方案里的一个模块参数,备注是:「以林工数据为锚,调整项目级权重」。
"把合同发我,"他说,"下周请他们吃顿饭。"
顾衔应了一声,去了。
晚上韦东来来找他,坐着喝茶,没什么要汇报的。
"听说林工那边签了,你高兴吗?"
"高兴,"他说,"钱是其次,这件事可以拿真实数据验证了,才是重点。"
"什么事?"
"规范层能解决问题吗,"他说,"林工他们的场景是最直接的测试,他们只看代码能不能进仓库,没有情面分。"

韦东来喝了口茶。"字节那边,你知道了吗?"
"知道,六周压成灰度,沈泽飞回去当晚就开会了。"
"你怎么看?"
想了一下,才回:"他们加速了,说明那天的谈话让他们开始认真对待云帆,而不是等着我们自己消失。这是好信号。"
韦东来盯着他:"对手加速是好信号?"
"对手认真,才会逼出我们最快的速度,"他说,"对手懈怠,我们容易松。"
那一周,麦景行把四、七、十三条全部啃完,其中一条卡了两天的bug,凌晨两点在群里发了截图。
陈修看到,在下面回了一个字:"牛。"
隔天早上会议,他把第四条的实现细节翻出来讨论了半小时,是那种"值得认真对待"的翻法,要在上面继续往前推,认可里面的路子。
陆衍在会议室里听了二十分钟,没有开口。
团队开始真的把一件事当成自己的事——这种状态,他见过几次,每次之后产品都会往前推一截,靠的是"懂了",而不是加班。乔木军从去年组起来到现在,这已经是第三次。
会议结束之前,他说了一句:
"周五给我一个阶段报告,我要看你们觉得最难的地方在哪,现在的方案够不够用。"
他点头,散会。
那周快结束的时候,商雁发来一张曲线图,没有附文字,过了三分钟才发来一条:
"你看一下,有没有发现什么。"

打开图,和上次那张对比了一下。斜率没有变陡,但交叉节点又往前挪了一格,上面有真实采集点的标注,来自实测数据。
把图发回去:"这是实测的?"
"对,测试企业三家,平均值,林工那边最高。"
放下手机,在那里坐了一会儿。
规范层还没有上线,只是企业版早期约束层。现在的实测就已经好过之前的预测曲线,等规范层真正跑起来,那条线会走到哪里,不知道,也不用现在算。
回了商雁一条:继续盯,实测数据只要稳,不用每天看趋势。
傍晚,他一个人打开了船坞。
把这一周发生的事情,简短说了一遍:乔木的方案调整,麦景行的十七条,林工合同签了,商雁的曲线往前了一格。
三道光,听着。
豆包先说:
> 都在往前走,都是真的。
Claude那道蓝紫光:
> 规范层,你现在最担心什么?
"数据量,"他说,"前三个月,接入的企业不够多,规范层的模型质量上不去。"
> 林工是第一个,但你有三家了。
"速度是问题,"他说,"字节六周内会上线,上线之后有一段时间,他们的分发会压我们的新增。规范层如果这段时间内没跑出来,护城河就还没完成。"

Codex那道翠绿光,一行字:
> 把这段时间压短。
盯着那行字,想了一下。
三道光里,有时候最直接的,反而最有用。压短这段时间,靠让现有那几家用得更深,数据积累得快一点。
"让顾衔明天联系那三家,"他对豆包说,"问他们愿不愿意给更多commit历史,换约束层的优先级定制。"
> 好。
他把船坞关了,把v0.1文档打开,在数据策略那一节,加了一段:
「冷启动加速:以深度数据换优先定制,激活现有企业的数据贡献意愿。」
这十一个字,是这段沉默推出来的。
那天,"留着"文件夹里,多了第十二条。
是林工合同上盖章之后的时间戳,截图存下来的。
这条和前十一条不同。前十一条,都是别人说云帆的话,或怀疑或误判或认可。第十二条是一个时间戳,是一家公司按真实价格签下来的数字,没有人多说什么,就这样在文件夹里落下了。
他把那个截图对折了一下,关上了文件夹。
第二天早上,顾衔转来一条消息:另外两家测试企业都回复说,愿意开放脱敏版本的commit历史数据,换约束层优先定制。
三家企业同时给数据。规范层的冷启动窗口,比他预估的,短了快一个月。