哈哈小说
第 6 卷 · AI 的前夜 · 第 92 章 · 36 段 · 1516 字

签约

第九十二章 签约

周一上午,协议打印出来,在星汇云的一楼会议室,花了大概二十分钟走完签字和盖章的流程。

标的比一期高六成。执行周期六个月,覆盖二十三个模块,验收标准和一期相同:注释触发准确率 88% 以上,按模块验收,不验收不结款。这个数字,是云帆提出来的,星汇云接受了。

他签了字,林博文的助理代表林博文盖了章,然后把合同一式两份,各自留一份。

签约当天,项磊没有出现在那个会议室。整个流程,没有任何人提上周三比较会上的那件事。


出来之后,乔木在楼道里跟上来,低声问他:「那个数字的事,最后怎么处理的?」

「让林博文看到了。」

「然后呢?」

「然后合同签了。」

插图

两人都没有再说。

那行数字出现在对方报告里,林博文收到了那份内部初稿,时间戳比对下来结论很清楚。至于是什么最终导致林博文在比较会上直接点破,那不是他的事了。

项磊的问题,他没有去追。也没有必要去追。项磊在中间是怎么处理的,或者他什么都没做、只是出现在了一个不该出现的文件路径里,这件事没有结论,也不影响合同的走向了。


停车场在地下,走下去的时候他打开了手机,看了一眼消息列表。

有一条是船坞系统的账单通知。

他点开来看了一眼。这个月,算力花销超出预算三倍。

数字在屏幕上放着,他站在停车场的灯光下,把那个数字在脑子里过了一遍。超出三倍的原因,他大概知道:二期准备阶段,麦景行跑了几轮不同参数组合的批量测试,模型调用次数放大,再加上他让 Claude 做了三份不同格式的成本对照表,每次都调用了长上下文。

插图

单次不贵,频率乘上去,账单就不一样了。

她走到他旁边,看见他盯着手机,没有说话。

「账单超了。」他把手机收起来,「三倍。」

她皱了一下眉:「修复一下调用策略,控制频率,应该能降。」

「不只是策略的问题。」

这个月二期才刚开始,还没有进入正式批量处理阶段。六个月,二十三个模块,要跑的批次只会更多。算力账单的问题,现在看到的只是一个开头。


他没有在停车场多待,把车开出来,上了路。

插图

窗外的楼还在往后走,他想了一会儿今天签掉的那份合同和手机里还没有处理的账单。

这份合同带来的收入,够覆盖六个月的人力、运营和一期留下来的一些杂项。但算力这块,现在的花法如果不控制,六个月下来,边际利润会被吃掉大半。

他在一个路口停下来,等红灯,拿出手机,在船坞的输入框里打了一行字:

「算力成本这个月超出三倍,项目规模会继续扩大,六个月内靠调参解决不了根本。能不能从用法层面入手,把算力用在真正需要的地方?」

豆包的那道光亮起来:

> 从调用模式上看,长文档注释分析频繁触发大模型,但大量工作是重复性模式的处理,不是真的需要智能推理。可以区分「需要模型推理」的头部任务和「模式匹配即可」的长尾任务,把长尾那部分走规则引擎或小模型。目标是找到算力真正值钱的地方,把大模型留给真正需要推理的任务。

Codex:

插图

> 如果批量任务可以被拆解成流水线,那前段可以用轻量端侧模型做初筛,只有通不过的才进大模型,进大模型的时候带着初筛结果做上下文,减少多轮推理。这是一个工程问题,方向是分级调度。

他把这两条建议看了两遍,放下手机。

分级调度这个方向是对的,但这不是下午能做完的决策。这要把现在的调用链重新梳理,区分哪些任务是可以降级的,哪些不能,还要测每种处理方式的质量是否达标。

这个问题,是二期里面比"怎么签合同"更需要想清楚的一件事。


到公司之后,他给麦景行发了一条:「账单看了,三倍。等你有空,我们把这个月的调用记录拿出来过一遍,找一下哪些地方可以分级。二期正式开始之前,这个问题要提前解决。」

麦景行回:「我今晚整理一下,明天给你一份分析。」

协议落地了,麦景行连夜整理的调用记录分析今天早上也发过来了。他还没打开,但标题行的第一个字段让他多看了一眼:主模块。