語言指紋

語言指紋是指作家的一種創作習慣。由於不同的作家具有不完全相同的語言文化背景、性格、生活經歷、日常慣用語的緣故,同一作家之手的不同作品,往往包含許多類似的行文習慣和句式,而不同作者的作品則缺少或不完全具備這種特徵,就像作者在作品中留下“指紋”一樣。語言指紋分析可用於分辨文章的原作者。

基本介紹

  • 中文名:語言指紋
  • 提出者瑞典研究人員
  • 提出時間:2009
  • 適用領域範圍:作家
語言指紋基本原理,“母本”理論,語言指紋研究進展,語言指紋研究展望,語言指紋對比分析實例,

語言指紋基本原理

瑞典研究人員設計出一種分析作家“語言指紋”的公式,通過分析作品中較少出現的單詞數與作品長度間的關係來研究作家的寫作習慣。這項研究成果發表在2009年12月10日出版的《新物理學雜誌》。

“母本”理論

研究人員說,一位作家的某一部作品其實只是從其“母本”中抽取的一部分。
所謂“母本”,可以大致理解為某位作家的語言習慣和辭彙量構成的“框架”。作家的每一部作品都從這一“框架”中來。
美國哈佛大學語言學家喬治·齊普夫於1935年發現一部作品中某一單詞出現的頻率與這一頻率高低次序之間的關係。他指出,最高頻單詞比第二高頻單詞出現頻率高一倍,比第三高頻單詞出現頻率高兩倍,以此類推。
齊普夫揭示的這一規律為後來許多語言學中的定量研究奠定了基礎。不少學者把它當作英語甚至所有語言中普遍適用的原則。

語言指紋研究進展

瑞典于默奧大學研究人員在齊普夫的這一理論基礎上進一步研究指出,該理論並非放之四海皆準。一部作品中單詞出現的頻率高低與作家本人語言水平有關,不能一概而論。
研究人員經過分析托馬斯·哈代、赫爾曼·梅爾維爾和戴·赫·勞倫斯三位作家的全部作品後發現,隨著作品篇幅加長,文中出現生僻單詞的幾率呈現下降趨勢。
他們還發現,這三位作家的“生僻單詞出現幾率下降曲線”各不相同。更重要的是,這種下降趨勢在每位作家的全部作品中都有所體現。
研究人員認為,今後在研究作者不詳的作品時,可以用這種方法將其與已知的前人作品相比較,對比這種“語言指紋”的相似性。

語言指紋研究展望

母本”這一概念不僅包含某位作者掌握的辭彙,還包含他自創的新辭彙。不論是寫《戰爭與和平》這樣的名著,還是平時隨便寫寫電子郵件,人們都有可能創造出新辭彙。
研究小組將繼續對更多使用英語和其他語言的作家展開研究。隨著他們的“語言指紋”庫不斷擴充,研究人員期望未來能夠利用這種方法鑑定出作者不詳的作品“身世”之謎。

語言指紋對比分析實例

一部名為《愛德華三世》的英國著名歷史劇自1596年問世以來一直作者不詳。有人認為它是文藝復興時期英國劇作家威廉莎士比亞所作,因而稱它為“莎士比亞疑劇”。
英國倫敦大學英語研究學院教授布萊恩維克斯爵士認為,出自同一作家之手的不同作品,往往包含許多類似的行文習慣和句式,就像作者在作品中留下“指紋”一樣。因此他利用一款軟體對《愛德華三世》劇本和同時期莎士比其他作品進行對比研究。
維克斯利用一款名為“剽竊”的軟體對《愛德華三世》劇本和同時期莎士比亞其他作品進行對比研究。分析後發現,這部劇本與1596年前的莎士比亞作品出現相同短語200處,當發現200處短語與莎士比亞劇作相符時,幾乎可以肯定這部劇本也出自莎士比亞之手。但這些匹配情況只出現在4場,即40%的劇本中。
這款名為“剽竊”的軟體由荷蘭馬斯特里赫特大學開發,其初衷是為了檢查學生是否有抄襲行為。軟體會從已知作者的作品中“學習”三個單詞以上的短語,然後在另一作品中搜尋這些短語。
但無人能說出為什麼劇本其他部分里卻包含明顯不是莎士比亞風格的詩句。
他經過進一步研究發現,剩餘部分劇本的寫作風格與當時另一位劇作家托馬斯基德相同,因為其中包含約200處與基德作品中相同的短語。他認為,這表明該劇有60%是基德所作。綜合分析認為,這部戲劇由莎士比亞和基德共同完成。
基德的代表作《西班牙悲劇》被認為開創了英國復仇悲劇先河,對莎士比亞戲劇有重要影響。
維克斯的最新研究成果並未使爭議結束,反而引發了更多人的懷疑。莎翁故居信託管理機構負責人斯坦利韋爾斯說:“僅憑一款電腦軟體就確定劇本作者的方法難以令人信服。沒有親自深入研究,就不能輕易得出結論”。也有人認為莎士比亞的地位如此之高,沒有必要與別人合寫一部劇本。但英國沃里克大學教授喬納森貝特說,與往常人們心中那個“孤獨才子”相比,這一研究成果反映了更為真實的莎士比亞。韋爾斯也說,把莎士比亞請下神壇很好。“他不是高人一等的聖人,而是能與任何人合作的劇作家;他不是孤傲的神靈,而是我們中間一個普通人”。

相關詞條

熱門詞條

聯絡我們