热点关注
随机推荐
机器翻译传奇
来源: 作者:本站
自1957年美国语言学家乔姆斯基发表著名的《句法结构》 始直到70年代, 语言学中的“乔姆斯基革命”不断发展,不仅极大地推动了现代语言学科的成熟,而且使得“自然语言理解”的研究不同程度地涉及到句法、语义和语用三大语言学领域,机器翻译从此开始走向复兴。 这里,我们不得不占用一些篇幅,结合“自然语言理解”早期研究中的成果,对三个语言学中的概念作一点趣味性的说明。
让计算机学习人类的语言,入门的练习似乎可以象小学生那样从“填空”学起。准备 几种类型的单词,在事先造好的句式中故意留下几个空格,要求计算机有选择地填入。例如,对于下列句式: 开往______的______列车在______时从______站台发车。 计算机只要在4个空格处分别填入表示地点、 车别、 时间和站台的词汇即可。实际 上,某些火车站就利用语音合成装置以这种方式进行广播。填满空格后的句子可能成为: 开往 纽约的特快列车在13时从3站台发车。然而,在计算机没有理解上述句子意义之前,人们必须为它准备与每个空格对应的适当词汇,否则,任它自由填入一些单词,句子可能变成: 开往地狱的疯狂列车在午夜时从魔鬼站台发车。 不管哪个火车站的广播里报出这种通知,恐怕都会把旅客们吓得半死。
人类语言中的词汇是不能随心所欲加以组合的。词汇不仅有名词、动词、代词、形容 词、副词等词性区别,它们的组合还必须遵循一定的规则。例如,汉语中的代词“我”、 名词“饭”和动词“吃”,按上述顺序排列成“我饭吃”,谁看了也不会认为是汉语中的 句子。 这三个词必须按照汉语的句法, 分别充当句中的某一成分, “我” 充当主语, “饭”充当宾语,“吃”只能作谓语,组成“我吃饭”即“主——谓——宾”句式。这就 是句法分析,当然,更多的句子要比“我吃饭”复杂得多。但是,即使我们完全遵守句法 规则造句, 也不一定就能够得到有意义的句子。 例如在上句里交换“我”和“饭”的位 置,造出一个“饭吃我”的句子,句法上挑不出一点毛病,但不好理解,或者说这是一个句法正确但没有意义的句子,它表明了句法和语义是语言学中不同的知识领域。
为了便于机器翻译,首先需要把自然语言的句子经过句法分析,分解为不同的成分。 然而,一些句子可以有不同的分解方法,不同的分解会产生不同的语义。请看下一句子的两种分解法:咬死了猎人--的狗。咬死了--猎人的狗。 前一分解法应解释为:狗把猎人咬死了;后一分解法则应解释为:把猎人的狗给咬死 了。这就叫“句法歧义”。会产生歧义的句子在语言中比比皆是,再比如:“一个半劳力”。如果让机器作句法分析,是分解为“一个半”“劳力”,还是分解为“一个”“半 劳力”呢?这些例子说明在句法分析时,还需要补充许多有关语义和相关知识的信息,有 的句子还必须结合上下文的关系才能获得正确的分析结果。 例如, 知道了上文是“狼来了” , 理解下文“咬死了猎人的狗”时,就不会再有歧义;或者上文是“我爷爷年纪大了”,下文是“他只能算一个半劳力”,联系上下文一起分析,“一个半劳力”便只剩下 一种含义。
上一页 1 2 3 45 6 7 下一页