来源:https://mp.weixin.qq.com/s/qG4QtO7t6xgYo-gTpOVYFg
长期以来,语言科学中存在一个核心假设,即语言的心理表征是基于成分(constituents)的,即根植于语法的层级结构(hierarchical structures)。生成语法学派认为语言由词库和生成语法(通常体现为短语结构规则)组成。另一种建构主义(constructionist)观点则认为语言由各种“构式”(constructions)组成,这些构式是形式与意义的配对,从单词到固定短语再到抽象框架不等 。
然而,近年来的实验研究发现了一类被称为多词语块(multiword chunks)的语言表征(如“in the middle of”)。这些语块在加工上具有优势,但在传统的层级语法中往往不是完整的成分,也缺乏建构语法所要求的约定俗成的意义。这表明,人类大脑中可能存在一种比传统成分更基础、更线性的语言表征形式,这种形式既不完全符合生成语法的层级规则,也挑战了建构语法对形式-意义配对的依赖 。本研究旨在填补这一空白,通过实证探究这种非层级、线性的语言结构是否存在心理现实性。
01.每一次我们开口说话,其实都是一场“即兴发挥”
来自文理学院的心理学教授 Morten H. Christiansen 表示:“人类拥有一种非凡的能力,几乎可以谈论任何事物,有时甚至能把词汇组合成前人从未说过或写过的句子。”语言学家认为,这种灵活性源于我们内在的“心理表征”。它能帮助我们识别语言中的模式,并将单词组合成有意义的语句 。Christiansen指出,虽然这种能力是沟通的基石,但科学家们仍在努力弄清楚这些心理模式的具体形态及其运作机制 。在一项新研究中,Christiansen 与奥胡斯大学(Aarhus University)的合著者 Yngwie A. Nielsen 提出了一种全新的思路,以此来解释语言在我们大脑中是如何呈现的 。他们的研究成果挑战了一个长期存在的观念——即语言必须依赖高度复杂的语法结构 。尽管该研究主要针对英语,但作者认为其结论可能适用于多种语言,并可能对未来的研究产生深远影响,包括语言如何演化、儿童如何学说话以及成年人如何习得新语言等领域 。
02.从“语法树”到“乐高积木”
多年来,研究人员一直假设句子的构建依赖于一种内在的语法,它将词汇组织成层层递进的结构,就像一棵分叉的树 。
然而,Christiansen 和Nielsen 提出了一个更简洁的替代方案。他们认为,语言可能更多地依赖于组合那些我们熟悉的“模块”,这就像是用预制的乐高积木(比如现成的门框或轮子组件)来拼搭出一个完整的结构 。这种观点认为,说话者使用的是短小、线性的词类序列(包括名词和动词),而不是完全依赖抽象的语法规则 。其中一些序列甚至根本不符合传统语法的定义,比如“in the middle of the”(在…中间)或者“wondered if you”(想知道你是否…) 。
这项研究已于 1 月 21 日发表在《自然-人类行为》(Nature Human Behaviour)期刊上 。Christiansen 提到,至少从20 世纪 50 年代开始,语言学界的主流理论一直强调,这种层级化的心理结构是人类语言的一个决定性特征 。该框架认为,单词和短语是根据语法原则组合成更大的单元,这些单元被称为“成分”(constituents) 。举例来说,在句子“She ate the cake”(她吃了蛋糕)中,单词“the”和“cake”组成了名词短语“the cake” 。接着,这个短语与“ate”结合,构成了动词短语“ate the cake”,最后再与“she”结合,形成一个完整的句子 。“但并非所有的单词序列都能构成这种‘成分’,” Christiansen 和Nielsen 在论文摘要中写道 ,“实际上,语言中最常见的三四个单词的序列往往是非成分的,比如‘can I have a’(我可以要一个…吗)或者‘it was in the’(它在…里面)。”
03.“非成分序列”的隐秘作用
由于这些“非成分序列”不符合传统语法的规范,它们一直被研究者所忽视 。但研究人员发现,它们在说话者对自身语言的认知中,实际上发挥着作用 。
通过眼动追踪研究和电话通话分析等实验,他们发现词类的线性序列具有“启动效应”(priming)——也就是说,当我们听到或读到它们一次后,下一次处理它们的速度会更快 。Christiansen 表示,这是强有力的证据,证明它们构成了我们语言心理表征的一部分 。换句话说,它们是我们大脑中语言图谱的关键组成部分,而且这种存在超越了语法规则的范畴 。Nielsen 说道:“我认为这项研究的主要贡献在于,它揭示了传统的语法规则无法涵盖语言结构在心理层面的所有表征方式。”Christiansen 补充道:“我们甚至可能用这种更‘扁平化’的结构来解释我们日常是如何使用语言的。” “重要的是,如果我们不再需要那一套复杂的层级句法机制,这可能意味着人类语言与其他动物交流系统之间的鸿沟,比我们过去认为的要小得多。”
04.讨论及启示
研究证实了除了层级成分和固定构式外,人类语言系统中还存在一种线性的、非层级的结构表征。这挑战了生成语法关于成分是唯一结构单元的观点,同时也挑战了建构语法关于结构必须有对应意义的假设 。作者提出“加工粘合剂”(processing glue)假说,认为这些非成分结构(如“top of the”)在加工过程中起到了连接传统成分(如“on the top”和“the tallest mountain”)的作用,促进了语言的实时整合 。这种表征可能反映了大脑在处理语言时留下的“加工轨迹”(processing traces),类似于动物在森林中踩出的路径 。
同时也说明了语言学理论需要扩展,以容纳这种纯粹基于分布规律习得的线性结构,不能仅局限于层级树状图。许多以往关于成分结构的启动研究可能混淆了这种非成分的线性启动效应,未来的研究需对此加以控制 。这一发现支持了基于序列学习和分布统计的语言模型(如RNN或LLM),这些模型不依赖预设的层级语法也能捕捉语言规律 。