第七十五章 全量
周六早上九点,他从床上起来,乔木的消息已经在手机上等着了。
「昨晚项磊那条,我昨晚就看了,没回你是因为我也在想。你早上有空吗,我打过来?」
「打来。」
电话两分钟后接上。
「先说我的判断,」乔木开口,「全量接入比子模块验证复杂得多,但如果他们真的愿意全量跑,这对我们来说是大机会。天象云是一个主仓库,凤合是两个大仓库,星汇云八个仓库全量跑下来,这是一个完整大客户案例,以后见同类客户可以直接拿出来。」
「对,这个我也在想。天象云是一个主仓库的demo,凤合是有历史重写问题的进阶验证,星汇云如果全量跑,是第一个量级完整的案例。」
「正是,」乔木说,「这个量级出结果,以后见同类规模的客户,直接说:我们有星汇云全量接入案例,对方会认真看。」
「他为什么这么急,」陆衍问,「引荐那天说先跑子模块,昨晚变成全量,两天就换了说法。」
「应该是内部有人推了一下,」乔木说,「技术那边评估下来,子模块验证意义不大,主仓库才是真实问题所在,干脆直接上。他们动作快,说明内部决策链短,老大支持的话就直接来。」
「风险也有,」乔木继续,「全量比子模块大十倍不止,万一哪个模块覆盖率跑不上去,客户会觉得我们承诺过度了,这个要防。」
「所以要加条件。」陆衍说,「全量接,但分阶段验收,不是一口气吃下去。」
他把思路过了一遍:

星汇云八个仓库,主仓库是Java单体,中间件三个,基础服务四个。魏城问的是跳过子模块试点直接跑全量,但可以分阶段:先跑主仓库的Java核心包,覆盖率80%,验收通过,再把其余仓库加进来。风险可控,客户拿到的最终结果还是全量接入。
「方案是这样,」他说,「全量接可以,但分阶段验收。第一阶段跑核心包,两周,覆盖率80%,退款条款对应这一阶段。通过了,第二阶段再推中间件和基础服务,标准一样。两个阶段总计四周。」
「这个方案比子模块试点还稳,」乔木说,「因为验收节点更明确,每个阶段都有对应数据。」
魏城要的全量都给,但验收切成两刀,每刀都有数字、有退款线。炸了也只炸一刀,整单不会被打穿。
「对,你把这个写成回复,发给项磊,让他转给魏城。语气不要太客气,直接说方案,让他们判断。」
「好,我写。」
他喝着水,等着。
乔木发来草稿,他看了一遍,改了两处措辞,回了「可以发」。
等了大约二十分钟,项磊回了:「我把方案转给魏城了,他让我跟你们说,这个方案可以接受,第一阶段的合同我们这周内来准备,下周一正式签。」
把这条截图发进内部群。
他往后靠了一下椅背。
凤合从第一次接触到拿到签约意向,磨了将近两周。星汇云从谭宝引荐到魏城接受方案,四十八小时。

把这条发进内部群,乔木沉默了十几秒,才回来一句:「这速度,是客户自己往我们怀里撞。」
「别飘,」他回,「这单还没跑完,先控风险。」
「合同签了就可以正式开始,」他说,「让顾衔今天整理一下合同模板,按两阶段结构出一份,让乔木看一遍,下周一给他们。」
乔木:「了解,我来盯。」
顾衔:「今天出,下午给乔木。」
下午麦景行发来进度更新。
「跟你说一下sprint进度。今天是第三天,识别层基本完成了。tokenizer改造跑通了,单测通过率93%,剩下7%是极端边界情况,今天下午跟秦朗再过一遍。」
「剩下的问题是训练分离:中文路和英文路的语料分桶逻辑已经写完,但还没跑完整流程,下周一开始接星汇云的实际语料做第一轮训练测试。」
「三周计划目前在轨,识别层完成,训练分离进入测试,下周一进入实测。」
「好,那个7%的边界问题,今天搞完,不要留到下周。」他回,「实测的时候用项磊发来的那批样例,不要自己造数据,和真实场景对齐。」
「知道,样例已经存了。顺便说一下,秦朗把训练分离的语料分桶逻辑走了一遍,中文路和英文路的数据质量他说比预期干净,项磊那批样例标注比较规范。」
「有海外工程师的团队,一定踩过注释混乱的坑,修规范是吃过亏的,」他说,「别分析原因,直接用就行。」

晚上他和乔木再核了一遍计划。
「现在两个阶段:核心包先跑,通了再推配套仓库。合同按阶段出,各阶段验收后分别付款,退款条款对每个阶段独立适用。」
「这个结构比较清楚,客户也好理解,」乔木说,「顾衔下午把模板发我了,我看过了,退款条款的触发条件写得清楚,按阶段覆盖率来。」
「风险那边,」他说,「双语注释那个能力要在进入第一阶段实测之前上线。现在sprint第三天,识别层跑通了,还有两周多,要盯住。」
「麦景行那边我也会盯,」乔木说,「如果识别层的7%边界问题今天没解,明天我问一下。」
「嗯,让麦景行自己回,今天应该能搞完。」
船坞里,今天简短。
「条件接受了,核心包先跑,下周一签合同。双语注释sprint第三天,识别层跑通了,训练分离进测试,下周一用实际语料跑。」
豆包那道暖橙的光:
> 分阶段方案比直接全量更聪明。第一阶段如果顺利,第二阶段客户不会犹豫;如果第一阶段遇到问题,退款只在第一阶段,不会把整单打掉。风险切了,收益没少。
「就是这个逻辑。」
Claude那道蓝紫光:

> 合同节点明确之后,销售材料也可以更新了。天象云是单仓库,凤合是双仓库+重写场景,星汇云是八仓库+双语注释,三个案例覆盖了三类不同复杂度,让乔木整理成横向对比,下次见同类规模客户直接用。
「告诉乔木,等星汇云第一阶段完成,整理成案例对比。」
Codex那道翠绿光:
> 识别层93%单测通过率,那7%的边界情况要看具体是什么。如果是中英同行注释(同一行里先英后中或反过来),这种在星汇云主仓库的那10%混排里大概率出现,今天要解掉,不然实测直接炸。
「麦景行已经在看,今天搞完。」
窗口合上。
分阶段方案定了,合同下周一。双语注释sprint还有十八天。核心包那一轮的验收数字,比凤合还重要。星汇云是这个量级里第一个,跑好了,这条线就打开了。
电脑准备合上,麦景行发来一条:
「那7%边界情况,今天下午过了一遍。里面有一种模式:同一行里先中文后英文的行内混排。项磊发的样例里有四条这种写法,他们工程师平时就这么写,真实场景,不是极端边界。」
「多长时间能解?」
「明天给你答案。」