下一章 上一章 目录 设置
26、第26章 意想不到的瓶颈 ...
-
**慕尼黑,三天后**
排查进行到第三天,依然没有突破。
江临深几乎没怎么睡,眼下的青黑越来越重。会议室的白板上写满了可能的原因,又一个一个被划掉。托马斯团队也到了极限,有个年轻工程师因为连续熬夜晕倒了。
“这样下去不行。”第四天早上,江临深说,“我们需要换思路。”
“什么思路?”
“如果不是系统问题,会不会是……数据问题?”
托马斯愣住了:“数据我们检查过,输入输出都正常。”
“我是说训练数据。”江临深调出系统的机器学习模块,“这套系统的核心,是用了过去一年的生产数据训练出来的模型。如果训练数据本身就有偏差……”
“不可能。”托马斯很肯定,“训练数据是你们工厂提供的,我们反复验证过。”
“再验证一遍。”江临深坚持,“从最原始的数据源开始。”
这是一个庞大的工程。过去一年的生产数据,涉及几十万件产品,几百万条检测记录。中德团队分成两组,开始手动抽样复核。
江临深亲自带队。他坐在电脑前,一条一条地比对,眼睛盯着屏幕,一盯就是几个小时。有时候会突然停下来,揉着发疼的太阳穴,喝一口冷掉的咖啡。
第三天深夜,事情有了转机。
一个中国工程师发现了异常:“江总,您看这段数据。”
江临深凑过去。屏幕上是去年十月份的一批产品记录,合格率突然从99.5%跌到95.2%,然后又在一周内恢复到正常水平。
“这个波动……”
“我问过工厂那边,那周正好是设备大修,换了新的检测探头。探头精度更高,所以检出了一些之前漏掉的瑕疵品。”
江临深盯着数据,脑子里有什么东西在连接:“也就是说,那周的数据,其实更接近真实情况?”
“可以这么说。”
“但系统训练时,把这些数据当成了‘异常值’,权重降低了?”
工程师点头:“按照算法逻辑,突然的波动会被平滑处理。”
江临深站起来,在会议室里走了两圈。然后他猛地转身:“这就是问题所在!”
所有人都看向他。
“系统的训练目标是‘稳定’——它学习的是过去一年的‘平均表现’。但真实的生产环境,永远存在波动。设备更换、原料批次、甚至天气温度,都会影响细微的质量表现。”
“所以当系统遇到稍微严格一点的标准,或者稍微‘异常’一点的数据时,它就会误判?”
“对。”江临深回到电脑前,“它把合理的波动,当成了异常。把真正的合格品,当成了需要剔除的瑕疵。”
托马斯听完翻译,沉思了几分钟,然后重重拍了一下桌子:“天啊,您是对的!这是过拟合(overfitting)的典型表现——模型太贴合训练数据,反而失去了泛化能力!”
问题找到了,但解决起来更难。
这意味着要重新调整算法逻辑,要重新训练模型,甚至可能要重新定义什么是“合格”的标准。
“需要多久?”江临深问。
托马斯计算了一下:“最快……也要一个月。”
“太慢了。”江临深摇头,“国内工厂已经停产,等不了一个月。”
“那……”
“我们分两步走。”江临深快速做出决定,“第一步,先发布一个临时补丁,放宽判定阈值,让工厂恢复生产。第二步,我们重新设计算法,这次不是追求‘稳定’,而是追求‘智能’——系统要能识别正常波动,要能适应变化。”
“这需要大量的计算资源……”
“江氏集团会提供。”江临深打断他,“钱不是问题,时间才是。”
## **华南,一周后**
临时补丁发过来时,林见清已经连续工作了七天。
工厂停了两条生产线,损失每天都在增加。更麻烦的是客户的追问——已经有两家客户打电话来,担心交货期延误。
“林总监,”陈组长看着屏幕上的补丁说明,“德国那边说,这个补丁会降低检测标准,让系统‘宽容’一些。”
“能解决问题吗?”
“理论上可以。但代价是,一些真正的瑕疵品可能会漏检。”
林见清沉默了很久。这是一个两难的选择:继续停产,损失会越来越大;使用补丁,质量风险会升高。
“安装补丁。”最后他说,“但同时启动人工全检。所有产品,系统检完,人工再检一遍。”
“工作量太大了……”
“加人,加钱,三班倒。”林见清很坚决,“质量不能妥协,交货期也不能妥协。那就只能我们辛苦一点。”
命令下达后,整个质检部进入战时状态。所有质检员取消休假,每天工作十二个小时。林见清亲自在现场协调,累了就在办公室的沙发上躺一会儿。
第四天晚上,张浩在复检时发现了一个真正的瑕疵品——一个几乎看不见的焊点虚接。如果这个产品流出去,可能会在客户那里引发短路。
“林总监,”张浩把产品拿过来,“要不是人工复检,这个就漏了。”
林见清看着那个小小的瑕疵,心里一阵后怕。他立刻打电话给江临深。
“临时方案有风险。”他说得很直接,“今天发现了一个漏检的严重瑕疵。”
电话那头,江临深沉默了几秒:“新算法还需要时间。”
“我知道。”林见清深吸一口气,“但我们必须有备用方案。万一新算法也失败了呢?”
“你有什么想法?”
“我想……建立双系统。”林见清说出自己的想法,“现在的智能系统继续用,但同时开发一套基于传统规则的辅助系统。两套系统并行,互相校验。”
江临深思考了一会儿:“可以。但开发工作量很大。”
“我来负责。”林见清说,“你专心解决算法问题,我负责搭建备份系统。”
“你会很累。”
“总比停产好。”林见清笑了,虽然笑容很疲惫,“临哥,这是我们的工厂,我们一起扛。”
## **慕尼黑,两周后**
新算法的开发,遇到了意想不到的瓶颈。
托马斯团队设计了几种方案,模拟测试效果都不理想。要么太敏感,把正常波动也当成问题;要么太迟钝,漏掉真正的瑕疵。
“我们可能需要更多样化的训练数据。”托马斯说,“不仅仅是你们工厂的数据,还要有其他工厂的,不同行业的,甚至不同国家的。”
“数据从哪里来?”江临深问。
“公开数据集有一些,但不够。”托马斯顿了顿,“江先生,我知道这个要求很过分,但……您能不能联系其他中国工厂,共享一些脱敏后的生产数据?”
江临深沉默了。在中国制造业,生产数据是核心机密,很少有企业愿意分享。
但他想到了一个办法。
“给我三天时间。”他说。
江临深打了十几个电话。给江氏集团旗下的其他工厂,给洪辰电子的兄弟企业,甚至给一些竞争对手——用技术交换作为条件。
有些直接拒绝,有些犹豫,有些要求签复杂的保密协议。但最终,有五家企业同意提供部分数据。
“为什么帮我?”有家竞争对手的老板在电话里问。
“因为这不是帮你我,是帮整个中国制造。”江临深说得很诚恳,“如果我们能做出真正智能的质检系统,受益的是整个行业。”
数据陆续发来,托马斯团队开始重新训练模型。这次的数据更多样,更复杂,但也更接近真实的生产环境。
训练进行了整整一周。期间服务器崩溃了三次,算法调整了五次,团队又熬了几个通宵。
但这一次,江临深看到了希望。