第68章 教授妙手回春,乔治敦焕发新生(5k))
《MIT辐射实验室系列》
一般人可能没听过这个名字
简单来说,这是一套涉及到无线电领域的百科全书
40年的时候,为了应对二战,阿美莉卡把全国最顶尖的物理学家与工程师调到MIT,成立了辐射实验室
实验室涉及到的项目涵盖了无线电、微波、雷达项目,二战中主要的无线电与雷达设备都产自这里
二战结束,政府停发经费
研究者收到了最后通牒,只有最后6个月时间
大家得利用这点时间将现有研究成果整理为教程然后实验室关门,大家哪来的回哪去
简单来说,当下它几乎涵盖了所有和射频电子电路有关的一切,为后来阿美莉卡的电子技术奠定了基础
沃森眼睛眯了起来:“教授,不太理解
这套书早在47年的时候就由麦格劳·希尔出版社发行了,很多高校的图书馆都有收藏,以的身份想去借一套不是什么难事”
《MIT辐射实验室系列》,1947年出版,后来阿美莉卡意识到不对劲,在1953年之后停止了出版
沃森说的没错,很多高校都有收藏
但想要查看,需要审核借阅者的身份
以林燃的身份,通过这道安全许可自然不成问题
“当然,但想借的是IBM手里的那套”林燃笑着举起红酒杯
没错,高校拿到的是阉割版
别说高校,就连后世一直到2020年,在公开场合能找到的《MIT辐射实验室系列》都是阉割版
理论上的东西基本上都有,最多就是像《微波磁控管》这一卷会少一些内容
但应用上的内容那被阉割的就厉害了
很多二战时候阿美莉卡在雷达上的核心应用都被阉割掉了
只有极少的机构能够拥有完整版
其中之一就是
虽然IBM在二战期间主要专注于打孔卡机器和早期计算设备,但IBM工程师与MIT辐射实验室有大量技术交流,尤其是在电子信号处理和计算支持方面
战后,IBM迅速进入电子计算机领域,吸收了雷达技术中的许多成果,像高速电路设计就是从其中吸取的
林燃甚至知道这套藏书就放在IBM的老巢,纽约的约克镇高地
虽然它名字里有MIT,但完整版连MIT都没有
这套藏书的完整版只在林肯实验室、劳伦斯伯克利国家实验室、阿美莉卡国家标准局、洛斯阿拉莫斯国家实验室和IBM手里有
其中林燃最容易拿到的自然是
要鼓吹人工智能是一方面,从IBM手里把完整版的《MIT辐射实验室系列》拿到手是更重要的一方面
这套丛书能够传回华国,无论在哪一方面都能节约大量时间
这套四十年代的丛书,别说1963年,哪怕六十年后也有其独特的价值
对于一个正在发展雷达、导弹制导和通信技术的国家,这套书提供了系统化的理论框架、设计方法和工程实践,能显著降低试错成本
“教授,这恐怕不是该知道的事情吧?”沃森接着说道
林燃用手往下压:“沃森,冷静,和珍妮·赫斯特的关系想必也知道
同为出版界,赫斯特家族知道麦格劳-希尔当年出版这套丛书有两套不是很正常?
这很奇怪吗?”
赫斯特同样是媒体帝国,麦格劳-希尔需要在赫斯特家族的报纸或杂志上刊登广告,推广其教科书或专业书籍
双方之间存在商业往来,因此知道《MIT辐射实验室系列》有两个版本确实不奇怪
林燃接着说:“知道担心什么,但的担心完全没必要
送到红石基地来,这套丛书只会在红石基地看,不会带出红石基地
甚至可以找麦克纳马拉为做证”
任小子再精,也猜不到门的存在
沃森听到这话,瞬间就放松了下来:“教授,早说嘛”
林燃的意思是走正大光明的程序
先让IBM跟国防部打申请,然后由国防部那边批准之后,再把这套书拿到红石基地
全程林燃不接触,然后也不会脱离国防部的管辖范围
毕竟红石基地尽管属于,但很大一部分安保还是国防部在做
沃森一下就放松了下来,还以为要搞违规操作呢
比如让把这套书送到家里,然后莫名其妙被毛子给用微型照相机弄到微型胶卷里,辗转到莫斯科
只要不是想这么玩就好
沃森如是想道:“教授,没问题,一定做到”
林燃微笑着点头,心想:“任怎么也想不到,老子有门”
两个月的时间转眼就过去,林燃像暴君般高效指挥着整个团队
尽管每天来乔治敦项目的时间只有半天甚至更少
但逼着加尔文搜集俄英科技文献,统计高频词对,亲自指导卡斯伯特和彼得修改IBM7090的程序,加入基于频率的词选择模块
每次有人出错,毫不留情:“这都做不好?们是工程师还是废物?”
两个月时间转眼过去
来视察的团队由国务卿腊斯克和国防部长麦克纳马拉亲自带队
提前得知消息的乔治敦项目成员都不由得感慨一句,教授不愧是教授
“如果不是教授,顶多是詹姆斯·里德上校来查看们这个项目”
“是啊,也就是教授才有这样的影响力”
“国务卿和国防部长,这是载人航天的待遇了”
原本最多来个上校,现在来的是堪比五星上将的文官
红石基地的一间实验室里,空气中弥漫着紧张与期待的气氛
荧光灯投下明亮而冰冷的光线,照亮了房间中央的主角,数台IBM机器并联在一起的庞大翻译机器,它的金属外壳上布满了旋钮和开关
要不是去年已经有深蓝的经验,短短两个月时间还真搞不定
机器周围环绕着低沉的嗡嗡声,夹杂着电子设备散发的热量和远处飘来为保持房间温度恒定的空调所带来的独特气味,这一切都见证了团队连日来对这台机器的改进与调试
加尔文站在机器旁,身姿挺拔,眼神中透着专注与自信
作为改进工作的主导者,对这台机器的性能了如指掌
今天,由将向这群特殊的来访者展示成果:官员、国防部翻译领域的工作人员和专家
们站在实验室的一侧,各自带着不同的神情,有的是好奇,有的则带着怀疑,甚至还有一丝冷漠
其中很多老熟人
像从事翻译的工作人员,老早就知道乔治敦项目
大家都从一开始的期待
当然期待,这玩意能给们减少工作量
结果等来等去,一直没等到给们配备上乔治敦翻译机器
包括们之前也去乔治敦大学看过,评价就是一坨屎,根本用不了
之所以大家这次会来,完全是看在林燃的面子上
不是冲着教授,们才不来呢
当然,其中对乔治敦项目焕发新生最有信心的就是麦克纳马拉
“教授,怎么不亲自介绍?”麦克纳马拉低声问站在身旁的林燃
“只是给们起到了一点小小的辅助作用,其实功劳全是乔治敦大学和IBM的研究人员们”林燃说
麦克纳马拉装作不满的样子:“教授,太谦虚了
给们设计的统计学方法都看过了,要是没有的参与,以乔治敦这帮蠢,em这帮家伙的脑子,恐怕再花十年也想不到”
当林燃在和麦克纳马拉窃窃私语的时候,人群中,为国防部工作的语言学家保罗·加文博士眉头微皱,手中的钢笔轻轻敲击着笔记本,一直对机器的实际能力持保留态度
哪怕是大名鼎鼎的教授亲自参与其中
旁边的詹姆斯·里德上校,一直负责审批国防部给乔治敦的预算,负责跟踪该项目,则双臂交叉,面无表情,军装笔挺
腊斯克则手持记事本,目光不时在机器和林燃之间游移,想在林燃和麦克纳马拉之间插话,但又没想好要说什么
加尔文清了清嗓子,声音平稳而有力:“各位先生,今天,们将见证机器翻译的最新进展在林教授的指导下,们显著提升了系统的准确性和处理复杂语言结构的能力”
加文博士推了推眼镜,率先发问:“改进?上一个版本在处理习语和句法歧义时表现得很糟糕这次们是怎么解决的?”
加尔文自信道:“们引入了基于频率的统计模型,通过分析双语语料库,系统现在能够更好地分辨词义并处理依赖上下文的翻译”
里德上校冷冷地插话:“说得好听让们看看实际效果时间紧迫,们要的是结果”
加尔文点点头,转身走向机器的操作台:“当然,们马上开始先做一个简单的演示”
熟练地在键盘上输入一句俄语:“Мыговоримомире”
机器立刻运转起来,内部零件发出轻微的咔嗒声和嗡鸣,几秒后,屏幕上显示出英文翻译:“e.”
房间里传出一阵低语,加文博士挑了挑眉:“不错,但这只是个简单句更难的呢?”
加尔文早有准备:“当然可以们试试有歧义的句子”
输入另一句俄语:“Ончитаеткнигу”机器迅速输出:“.”
加文博士点头,但仍不满足:“如果上下文不同呢?比如‘книга’指的是账簿而不是书?”
加尔文手指缓慢敲击键盘,输入新句子:“Бухгалтерчитаеткнигу”
机器略作停顿后显示:“.”
房间里响起一片惊叹里德上校的双臂缓缓放下,眼中闪过一丝惊讶,这和之前看到的乔治敦机器截然不同:“它是怎么判断的?”
加尔文解释道:“系统现在能结合上下文线索和概率模型进行推断‘Бухгалтер’(会计)提示了财务背景,因此选择了‘’”
之前负责翻译的工作人员思忖:“这对情报工作可能是革命性的”
加文博士走近机器,眼中多了几分兴趣:“想看看它如何处理更复杂的句子,比如多重从句或习语”
“让来试试”加文坐在输入设备前
加尔文点头道:“没问题”
加文博士略一思索,输入:“Времялетит,когдатывеселишься”
机器很快输出:“.”
里德上校却不为所动:“这很不错,但们需要它处理军事术语和技术词汇们的需求很具体”
加尔文直视的眼睛:“加文博士,可以再试试一些专业词汇,们已经开始整合专业词汇表,包括军事和科学术语”
加文博士思索片刻后输入:“Ракетаоснащенаинерциальнойнавигационнойсистемой”
机器翻译为:“em.”
上校眼中闪过一丝波动,罕见地露出一丝认可:“相当精确”
房间安静了片刻,所有人都感受到这一刻的分量
官员们交换了一下眼神,怀疑逐渐转为乐观
一位国防专家,一位面容锐利的女士,开口道:“加尔文教授,您的工作可能会改变们的行动方向
这台机器的速度和准确性确实和过去比起来有了很大的提高
多久能大规模应用?”
加尔文停顿了一下,谨慎回答:“如果有更多资源支持,们可以在六个月内开始扩展系统不过,们还需要继续优化算法和扩充语言数据库”
麦克纳马拉鼓掌,转身对沃森说道:“沃森先生,恭喜,们将获得国防部的订单”
然后接着对林燃说道:“教授,就知道肯定能做到”
最后才是加尔文:“加尔文教授,国防部后续会跟联系”
林燃说:
“大家也不要太乐观
乔治敦只能说能用,离用好还有很遥远的一段距离
IBM方面得提高机器的性能,性能越好,它的翻译准确度就越高
其次乔治敦大学这边要继续沿着设计的技术路线,不断挖掘它的潜力
但这条机器翻译的技术路线是有上限的
只有统计学方法上的更新换代,才能实现更好的翻译效果
不过等们挖掘到这条技术路线的上限之后,建议在这个过程中,乔治敦大学最好多招一些统计学和理论数学专业的博士参与到这个项目中来
最后是国防部这边,后续在使用乔治敦机器用于俄语翻译的时候,其实还是要依赖人工审核
能够帮们提升效率,但提升效率的程度有限,们不能完全依赖机器”
其实乔治敦的效果就和最早的翻译有点类似,纯机械式的翻译
不会按照语言特性进行优化
只是因为英语和俄语都和拉丁语系有关,只是有关,相关性不算低
但肯定比英语翻译成中文要简单得多
“当下这个版本的乔治敦翻译机器,在军事、科技这两个特定领域会表现的比较好,在其领域,以及对于复杂句和非专业语境下,它的错误率会比较高
俄语是高度屈折语言,名词有六格变化,动词有复杂的时态和体,而英语语法较简单,仅仅依赖词序和介词而已
乔治敦机器想做到准确处理格变化和词序调整,还是存在比较大的困难
们目前也只是通过概率表和上下文窗口缓解了多义词问题,规则系统确保了基本语法的准确性
简单句大概能够达到百分之八十到九十的准确率,但复杂句,像嵌套从句之类的还是很容易出错
对于新闻、外交声明这种结构清晰的文本,它的效果应该会很好
但对涉及到大量口语的对话,它很难准确捕捉细微差别,错误率可能会达到50%
觉得各位需要保持一个谨慎乐观的态度”
林燃说完后,腊斯克开口道:“教授,这已经足够了
对于目前白宫和国防部的需求来说,它只需要批量处理书面文本,像新闻、报告之类的就已经是很大的作用了
电话会议这种,们也没指望能够做到准确翻译”
确实,作为一个都快要被判死刑的项目,一年后被砍掉,甚至被认为是AI寒冬,现在被林燃两个月时间就救回来,当下具备了实际应用价值
这已经是一种飞跃了
访客们陆续离开,兴奋的低语在走廊里回荡
麦克纳马拉非要去林燃的办公室坐一会
“教授,关于想借阅《MIT辐射实验室系列》,这边已经批准了
最快应该后天IBM那边就会批准,包括当时的一些雷达设计方案之类的内容让林肯国家实验室一起提供给
正好也看看这方面的内容,看有没有什么灵感能够提供给们”麦克纳马拉一边喝茶,一边说道
林燃心想,妈的,好人啊!