第263章 通信情报分析智能化探索(第2页)
二、算盘上的算法启蒙
在设计 “密电特征提取算法” 时,团队遭遇 “国产计算机算力不足” 的困境。108 乙型计算机的内存仅 4kB,无法运行复杂模型,小李借鉴 1964 年原子弹数据处理经验,将算法拆解为 “词频统计”“句法分析”“模式匹配” 三个模块,每个模块单独运行并手工合并结果。“就像把大象切成块搬运,” 他在笔记本上画下数据流图,“先让计算机记住单字,再教它组词。”
最关键的突破来自 “贝叶斯分类器” 的手工实现。小李带着团队用算盘计算条件概率,在坐标纸上绘制了 128 张概率分布表,每张表都标满红蓝铅笔的修正痕迹。当他发现 “天气术语” 与 “军事行动” 的关联概率超过 0.65,立即在算法中增加 “环境数据加权” 模块,这个源自 1973 年台海气象情报的经验,让密电分类准确率从 62% 提升至 78%。
三、穿孔卡片的训练战场
8 月,团队进入 “数据标注攻坚战”。小李组织 12 名情报员,在保密室用红、蓝、绿三色笔标注密电的 “作战指令”“气象通报”“后勤调度” 类别,每张卡片的背面都签着标注员的姓名 —— 这是应对 “标注误差” 的责任追溯机制。“当年在延安,译电员要对每个字负责,” 他摸着卡片上的蓝色标注,“现在计算机也要学会‘负责任’。”
在处理 “同码异义” 难题时,小王发现某组数字串在不同月份代表不同指令,传统算法无法识别时间维度的变化。小李立即引入 “滑动时间窗口” 概念,将密电数据按季度切片训练,这个灵感源自 1974 年中越边境的 “季节性情报规律” 研究,让计算机首次具备了时间序列分析能力。
四、示波器前的模式暗战
9 月,模拟测试暴露出 “噪声数据干扰” 问题:敌方故意插入的假密电导致误判率飙升至 35%。小李盯着示波器上紊乱的波形,突然想起 1975 年在厦门监听站听到的 “诱饵信号”,“敌人在给我们下套,” 他立即修改算法,增加 “异常模式检测” 环节,通过计算数据熵值识别诱饵,这个改进让假密电的识别率提升至 92%。
更棘手的是 “小概率事件漏判”。当某份密电的 “兵力调动” 指令仅出现 0.3% 的概率,传统算法直接过滤,小李却带着团队重新标注了 3 万份低频数据,在模型中增加 “稀有事件补偿因子”,这个看似违背 “效率原则” 的坚持,后来被证明是捕获敌方 “特种作战指令” 的关键。
五、深夜机房的算力突围
10 月,团队在解决 “多源数据融合” 时陷入僵局:雷达数据、密电码、水文情报无法同步分析。小李带着图纸走访海军情报部门,借鉴 “声呐目标识别” 的融合经验,设计出 “三层数据耦合模型”,将不同来源的数据转化为统一的 “情报特征向量”,这个创新让计算机首次具备了跨域分析能力。