第七十章 安全委员会
周五早上八点,陆衍看到苏越的消息。
「陆总,昨晚谭总跟我说,他们这边有个安全委员会,每周六有例会,他想把我们云帆的接入方案和初版报告拿进去让他们看一眼。我们配合一下?」
苏越补了一句:「委员会里有个数据合规负责人,以前否过三家供应商的材料,说不清楚就直接退。如果明天过不了,天象云这条线至少要往后压两周。」
手机放下,在屏幕前坐了一会儿。
这个审查节点,他之前没有预估到。客户内部安全审查,通常是大公司的标配流程,审的是数据流向、权限边界、训练数据的脱敏标准。天象云是做云服务的,这套流程有是正常的。问题是产品文档里,关于数据处理和权限隔离的描述,是按合同要求写的,现在要放到更专业的安全审查视角下过一遍。这一关如果过了,天象云就是云帆第一块大客户合规招牌;过不了,前面两周全白铺。
「配合,」他回复了苏越,「需要什么材料?」
「谭总说最好有一份说明文档,讲清楚训练数据怎么存的、权限怎么控的、数据不会出去的逻辑,用语可以专业一点,他们那边是懂技术的人。」
转发给麦景行:「那边明天要审,今天给我出一份数据安全说明文档,包括:训练数据的存储隔离方案、权限控制逻辑、数据不出客户边界的技术实现,以及脱敏处理标准。语言对技术人员,写清楚就行。」
「下午出来。」麦景行说。
「今天上午,」他说,「下午给苏越时间看。」
「了解,我先停下手头的,上午写。」
发完消息,他打开产品文档,把当前的数据安全相关描述扫了一遍。有两个地方需要补充:一是多租户数据隔离的技术实现,目前文档里写得很简略;二是训练完成后模型权重的归属和存储位置,这块合同里有条款,但文档里没有对应的技术说明。

两个补充点发给麦景行,加了一句:「这两处要写清楚,那边一定会问。」
「都补进去,了解。」
同一时间,秦朗过来了。
「昨晚发的那条消息,凤合2019年大规模重写的事,我今天上午查了一下,情况比我预想的复杂一点。」
「说。」
「凤合2019年换了一次技术栈,旧的服务框架整体替换掉了,当时接手的新团队把旧代码按新规范重写了一遍。所以数据里有两套完全不同的代码风格:2019年之前是A风格,2019年之后是B风格,两套风格在命名规范、注释格式、函数分层上都不一样。如果现在整体送进去训练,模型会同时学到A和B,训练结果会在两套规范之间摇摆,覆盖率会乱。」
「怎么处理?」
「我想了两个方案。」他拿出一张手写的纸,「方案一:只用2019年之后的数据训练,覆盖率高但会丢2019年前的早期历史,有些老模块的命名惯例可能会漏掉。方案二:分两阶段训练,先用2019年前的数据跑一版,把早期风格锚点固定住,再用2019年后的数据做迁移学习,让模型学到风格演化的过程,结果能同时理解两个时代。方案二工作量更大,但结果质量会更高。」
陆衍看了一下那张纸上的逻辑图。这套方案意味着时间加倍,接入周期会延长,但凤合这个仓库的情况特殊,如果只做单阶段,训练质量可能达不到退款保障线。
「方案二,」他说,「给凤合那边发说明,告诉周天:我们发现他们数据里那次代码整体重写,为了保证质量,我们采用分段训练方案,接入时间会延长到三周,覆盖率保障不变。」
「这样要重新谈接入时间了,」秦朗说,「合同里写的是两周。」

「客户要的是结果,两周时限守住但模型训练成四不像,那才是真亏。」他说,「主动延一周,是为了以后少赔一百万。周天这边今天联系,解释清楚。如果他们有疑虑,让他们跟技术负责人确认一下2019年的重写,他们会认可。」
「明白,我今天联系周天。」
下午两点,麦景行的文档发过来了。
十一页,格式干净。陆衍从头到尾看了一遍,数据隔离那节写得清楚,多租户之间的物理隔离和访问控制都有描述,脱敏标准引用了合同附件里的条款,模型权重的归属写明了「客户端专有,服务方不留副本,训练完成后按协议删除原始数据」。
补了两处措辞,把「不留副本」改成更技术的表达,加了一行关于删除审计日志的说明。
发给苏越:「这份文档,供那边审阅,技术层面如有问题可直接问我。」
苏越回复很快:「收到,我转给谭总了。」
下午三点半,秦朗发来消息:「周天那边我解释了,他去问了他们技术总监,确认2019年那次重写是真实存在的,对我们换方案没有异议。他说他们技术总监也倾向于两套风格分开理解,这样结果会更可信。接入时间延长到三周,他们接受。」
「把这次方案调整做个记录,包括原因、分段训练的技术说明、新时间线,发给顾衔备案,合同那边做补充确认。」陆衍说。
「晚上发过来。」
当天晚上,秦朗和麦景行把凤合的技术设计做好了。第一阶段用2019年前的数据建立早期风格锚点,第二阶段用2019年后的数据做迁移学习,中间加一个风格切换节点的识别和标注。整体训练时间从72小时延长到120小时,初版预计下周三出来。
秦朗把文档发给陆衍:「技术方案确认一下,没问题的话我明天发给麦景行开始配置。」

他看了一遍,「可以,就按这个跑。」
周六下午四点,苏越发来消息。
「陆总,那边审完了,结论是没问题,数据隔离方案和脱敏标准都符合他们内部要求。谭总说,委员会本来准备问十几个问题,看完文档之后只问了两个细节。他说你们不像初创公司,倒像做过大厂合规体系。他让我谢谢你们。」
那条消息转进内部群,没有加评论。
乔木:「审查过了,这个也要写进话术。加一条:天象云内部审查通过,数据合规有背书。」
「加。」麦景行说。
顾衔:「这份文档,我存一份进客户文件夹,以后新客户如果问到安全合规,直接发改版本。」
「对,」陆衍回,「整理成模板,里面的客户特定信息留空,下次新客户来改这一部分就行。」
当天晚上在船坞里把今天说了一遍。
「天象云那边过审了,文档写得比他们以前看过的大多数服务商都清楚,这是谭宝原话。凤合那次重写的冲突,改成分段训练,接入时间延长一周,周天那边接受了。两件事同一天解决。」
豆包那道暖橙的光:

> 审查通过,这不只是天象云的合规节点,是你们可以对外说的资质背书之一。「通过天象云安全审查」这句话,比等保资质先到。
「乔木已经加话术了。」
Claude那道蓝紫光:
> 凤合这套分段方案,如果做出来效果好,本身就可以变成标准能力:处理有技术栈切换历史的代码仓库。很多成立超过三年的公司都有这种情况。过审之后,可以反向拿去打竞品:你们通过的审查,他们不一定能过。
「这个角度乔木会想到的。不过等凤合结果出来再说,现在先把质量做出来。」
Codex那道翠绿光,一行字:
> 今天两件事,合规文档能固化成模板,凤合的分段方案能固化成接入标准。麻烦解一次,就变成台阶,把同行甩在后面。
「顾衔在管模板,秦朗在写分段方案技术文档。」
窗口合上,日历翻了一格。
从今天起,云帆手里多了两块硬东西:过了天象云安全委员会,处理了凤合的代码重写冲突。这都是客户会问的,也是竞品解不了的。
下周三,凤合分段训练的初版结果会出来。那将是云帆的退款保障线,第一次被真正的数据来检验。