下一章 上一章 目录 设置
6、第 6 章 ...
-
晨光爬上窗台时,薛弥声还站在原地。
手机已经发烫,被她放在窗台上冷却。屏幕暗下去之前,最后显示的是和付聆雪的聊天界面——那张写满公式的草稿纸照片,下面是她发的“成功了”,再下面是付聆雪简短的“恭喜”。
简单得像是什么都没发生过。
但什么都发生了。
薛弥声的手指抚过冰凉的窗玻璃,触感让她微微战栗。远处创业园区的轮廓在晨雾中若隐若现,像一张褪色的老照片。她看见自己办公室所在的那层楼,窗户还暗着,要等一个小时后,第一个来加班的工程师才会点亮那里的灯。
三年前她租下那个办公室时,也曾这样站在这里远望。那时心里揣着一股狠劲,想着要做出成绩,要让付聆雪看见,要证明离开是对的。
现在她做到了。付聆雪看见了。但证明什么呢?
证明没有付聆雪,她也能解决技术难题?可刚才那个突破性的算法改进,分明是付聆雪给出的核心思路。证明她建立了成功的企业?可声觉至今还在生死线上挣扎,需要付氏的投资才能活下去。
证明她放下了?哈。
薛弥声转身离开窗边,赤脚踩过木质地板,走向厨房。冰箱门打开时,冷气扑面而来。她拿出那瓶昨晚没喝完的冰水,拧开,仰头灌了一大口。冰凉刺激着喉咙,让她清醒了些。
工作台上的电脑还亮着,屏幕上那个99.63%的识别率像在嘲笑她。她走过去,手指在触控板上滑动,调出算法改进前后的对比图。
蓝色曲线是旧版,红色曲线是付聆雪的思路。两条线在75分贝噪音阈值处交叉,之后红线一路向上,把蓝线远远甩在后面。图表下方是密密麻麻的性能参数:内存占用减少67%,处理延迟降低42%,识别错误率下降0.41%。
每一个数字都在说:付聆雪是对的。付聆雪总是对的。
薛弥声想起很多年前,她们还在读研时,有一次为了一个优化问题争吵。付聆雪坚持用拉格朗日乘子法,她非要试试遗传算法。吵了整整一下午,最后各做各的。结果付聆雪的方法收敛更快,精度更高。
那天晚上她赌气不回宿舍,在实验室通宵。凌晨三点,付聆雪拎着宵夜推门进来,什么也没说,把热腾腾的馄饨放在她桌上,然后坐在旁边,开始改自己的代码。
她吃馄饨时,付聆雪突然说:“你的遗传算法想法很好,只是不适合这个问题。如果换成粒子群优化,也许能行。”
她愣住:“你看了我的代码?”
“看了。”付聆雪眼睛盯着屏幕,手指在键盘上飞舞,“你把交叉概率设得太高,种群多样性损失太快。降到0.6试试。”
她试了,效果好了很多。但还是不如付聆雪的拉格朗日法。
“我输了。”她闷闷地说。
付聆雪转过头,很认真地看着她:“技术讨论没有输赢,只有最优解。而且你的思路给了我启发——也许可以把两种方法结合,先用遗传算法找初始点,再用拉格朗日法精调。”
她们真的那样做了,结果比单独用任何一种方法都好。那篇论文后来发在了顶会上,致谢里她们互相写着“感谢我的合作者无可替代的洞察力”。
无可替代。
薛弥声关掉对比图,打开加密文件夹。那个“声学智能”的愿景文档还在,像一头沉睡的巨兽。她点开,光标在标题处闪烁。
要不要现在发给付聆雪?凌晨的电话里,付聆雪说想“重新开始”,想“看看能不能走到一起”。如果给她看这个,意味着什么?
意味着交出全部的野心和脆弱。意味着告诉她:这三年我不仅在做声纹识别,我在构建一个你可能会觉得疯狂的蓝图。意味着问她:你还愿意和我一起做梦吗?
太急了。薛弥声对自己说。付聆雪说“从工作开始”,说“顺其自然”。那就从工作开始,从最实际的技术合作开始。
她新建了一个文档,开始整理刚才算法改进的详细报告。这是声觉的技术文档规范,每一个重大改进都要记录在案:问题描述、解决思路、实现细节、测试结果、后续优化方向。
手指在键盘上敲击时,晨光又亮了一度。金黄色的光线斜射进来,在工作台上切出一道明亮的光带。尘埃在光柱里飞舞,像微型的星云。
写到“解决思路”这部分时,薛弥声停住了。该怎么写?写“与付氏集团技术顾问付聆雪讨论后,采用图卷积频域方法”?太正式,太生疏。写“付聆雪建议”?太亲密,太私人。
她盯着空白处看了很久,最终写道:“参考图神经网络在频域的优化方法,采用切比雪夫多项式逼近拉普拉斯矩阵特征值分解,实现邻接矩阵的稀疏化表示。”
没有提付聆雪的名字,但每一个懂行的人看了,都会知道这思路来自顶尖高手。付聆雪的烙印,已经刻在了算法里。
文档写到一半时,手机震动了一下。薛弥声瞥了一眼,是付聆雪发来的消息,这次不是公式,而是一张照片:一杯咖啡,旁边摊着几张写满字的纸。
附言:“整理了一下时频域联合分析的难点列表。你觉得从哪个开始攻?”
薛弥声放大照片。咖啡杯是她熟悉的那只白色骨瓷杯,边缘有一道细微的裂痕——那是很多年前她不小心碰掉的,付聆雪没舍得扔,说“有瑕疵的东西更真实”。
纸张上的字迹工整清晰,列出了七个技术难点:实时性、精度损失、计算复杂度、硬件适配、噪声鲁棒性、多说话人场景、跨语言泛化。每个难点下面还有两三行简析。
典型的付聆雪风格:全面、系统、直击要害。
薛弥声回复:“实时性和精度损失是主要矛盾。先解决这两个,其他的可以迭代。”
“同意。”付聆雪秒回,“我有个想法,用知识蒸馏,让大模型教小模型。大模型离线训练保证精度,小模型在线部署保证速度。”
“蒸馏损失函数设计是关键。”
“嗯,我推了几个,都不太理想。传统的KL散度在时频域特征上效果不好。”
薛弥声看着这句话,脑子里突然闪过一个念头。她快速敲击键盘:“试过Wasserstein距离吗?时频特征可以看成概率分布,Wasserstein距离更能捕捉分布之间的几何结构。”
发出去后,她等了几秒。付聆雪没立刻回复,大概在思考或者计算。
薛弥声起身去煮咖啡。厨房里,咖啡机发出沉闷的轰鸣声,深褐色的液体一滴滴落入玻璃壶。香气弥漫开来,是熟悉的阿拉比卡豆的果酸味。这还是付聆雪推荐的牌子,说这家的烘焙度最平衡。
三年了,她换了住处,换了公司,换了社交圈,但咖啡豆没换。
端着咖啡回到工作台时,手机上有新消息。付聆雪发来一张新的草稿纸,上面是Wasserstein距离的推导过程,最后写着一个公式和一行小字:“试了,效果提升约3.7%。你怎么想到的?”
薛弥声抿了口咖啡,回复:“去年读的一篇迁移学习论文里的思路,一直没找到应用场景。”
“论文标题还记得吗?”
“《Wasserstein Distance for Deep Learning》,”薛弥声打字,“作者是MIT的团队,发在去年的ICML上。”
“我去找来看。”付聆雪说,“你的阅读范围很广。”
“逼出来的。”薛弥声实话实说,“小公司没有大厂的研究资源,只能多读论文,从学术界找灵感。”
“这也是优势。大厂的研究往往脱离实际场景,你们更懂落地。”
“付氏的研究院也脱离实际?”
“有些项目是。”付聆雪承认,“去年投了一个语音合成项目,音质好到可以假乱真,但推理速度要三秒,根本没法商用。团队还振振有词说‘技术领先性更重要’。”
薛弥声几乎能想象那个场景。付氏研究院的那些博士们,个个眼高于顶,追求的是顶会论文,是技术突破,是“改变世界”。至于这技术能不能赚钱,能不能落地,那不是他们考虑的事。
“所以你才看好声觉?”她问,“因为我们更务实?”
“因为你们在技术和商业之间找到了平衡。”付聆雪回复,“也因为你的技术品味一直很好。”
技术品味。这个词让薛弥声心头一动。付聆雪很少直接夸人,更少用“品味”这样的词。她说“技术品味”,意味着她认可的不只是薛弥声的能力,还有她的审美,她的判断力,她选择问题和解法的眼光。
这是一种更深层的认可。
薛弥声的手指在手机边缘摩挲,不知道该怎么回。说“谢谢”太轻,说“你也一样”太客套,说“我一直记得你说过,优雅的解法比粗暴的优化更重要”又太怀旧。
最终她什么都没回,放下手机,继续写那份技术文档。
晨光越来越亮,房间里的阴影渐渐褪去。工作台上,各种设备的指示灯在明亮的光线中显得黯淡。薛弥声写完文档的最后一个字,保存,加密,上传到声觉的内部服务器。
她看了眼时间:早上七点零九分。再过一会儿,她就要洗漱换衣,去公司开始新一天的工作。今天要和团队同步算法改进,要开产品规划会,要见一个潜在的客户,要审核下个月的预算。
但此刻,在这个晨光笼罩的房间里,她允许自己暂时停下。
薛弥声重新打开那个加密文件夹,点开“声学智能”愿景文档。她滚动页面,看着那些宏大的构想:从声纹识别到情感计算,从医疗诊断到空间音频,从消费电子到工业检测,最终构建一个以声音为核心的智能生态。
每一部分都有详细的技术路线图,有初步的可行性分析,有预估的资源需求,有潜在的合作方名单。这是一个需要十年时间、百亿资金、顶尖团队才能实现的梦想。
她曾以为只能独自背负这个梦想。
但现在,她突然想:如果告诉付聆雪呢?如果让她看看呢?
不是现在,不是今天,也许不是这个月。但总有一天,她可以把这个文档发过去,然后问:“你觉得,这可能吗?”
薛弥声关掉文档,关闭电脑。屏幕暗下去的瞬间,她看见自己的倒影——头发凌乱,眼睛下有淡淡的阴影,但眼神很亮,亮得像当年那个相信技术能改变世界的女学生。
她走到窗前。太阳已经完全升起,金黄色的光芒洒满城市。创业园区的那栋楼,她办公室的窗户依然暗着,但很快就会有光。
手机又震动了一下。这次是天气预报:今天晴,最高温度18度,空气质量良。
下面还有一条付聆雪的消息,没头没尾的:“瑞士的芯片样品,下周三到。我让助理直接送到声觉。”
薛弥声回复:“好。谢谢。”
“不用谢。期待看到你们的原型机。”
对话到此为止。但薛弥声知道,有些东西已经不一样了。
她们又开始分享技术灵感了。
她们又开始在清晨讨论问题了。
她们又开始期待下一次的合作成果了。
窗外的城市彻底醒来,车流声、人声、远处的施工声,交织成清晨的交响。薛弥声深吸一口气,转身走向浴室。
热水冲刷身体时,她想:今天要穿什么去见团队?要怎样讲解那个算法改进?要不要提付聆雪的贡献?
最后一个问题让她停顿了。提,意味着正式把付聆雪引入声觉的技术体系;不提,意味着隐瞒,意味着把付聆雪的贡献占为己有。
都不是好选择。
但必须选。
薛弥声关掉水,用毛巾擦干身体。雾气弥漫的镜子里,她的表情严肃。最终她决定:提,但要有限度。说“参考了图神经网络的前沿思路”,不说“付聆雪教的”;说“采用了频域优化方法”,不说“付聆雪凌晨三点帮我推的公式”。
这是保护,也是界线。保护付聆雪的隐私,保护她们之间刚刚重建的脆弱联系,也保护声觉团队的信心——他们不需要知道,那个让他们头疼数周的问题,是被付聆雪轻易解决的。
换好衣服,整理好包,薛弥声站在门口最后看了一眼公寓。晨光洒满房间,工作台上各种设备静静待机,窗台上的手机已经冷却。
她拉开门,走进清晨的走廊。
电梯下行时,她想:今晚回来,要继续写那个时频域联合分析的方案。周三晚上十点,要和付聆雪视频会议。下周三,瑞士的芯片样品会到。
一步一步来。从工作开始,从技术开始。
至于其他——那些深夜的坦白,那些晨光的期待,那些关于“重新开始”的可能性——让它们慢慢生长吧。
像种子埋在土里,不急着破土,先扎根,先吸收养分,先等待合适的时节。
电梯门打开,薛弥声走进晨光灿烂的街道。