也許你已經(jīng)對暢銷小說中一些老套的設定感到乏味,但你也不得不承認,盡管暢銷榜上的書日新月異,但最合大眾口味的題材往往只有屈指可數(shù)的幾種。美國兩位學者所著的《暢銷書密碼》利用電腦算法來分析:哪些要素能夠讓一本書進入《紐約時報》暢銷書排行榜?
作家安東尼·霍羅威茨(Anthony Horowitz)曾經(jīng)評論道,“暢銷書作家丹·布朗(Dan Brown)已經(jīng)一次又一次地向我們展示了,沒有典雅或蘊藉的文筆來遣詞造句,你照樣可以寫出暢銷書。”
但對那些想成為小說家,卻更關心發(fā)財而不是文學價值的人而言,有本書值得一讀。
斯坦福大學學者喬迪·阿徹(Jodie Archer)和馬修·約克爾斯(Matthew Jockers)所著的《暢銷書密碼》(The Bestseller Code)是利用計算機算法來挑戰(zhàn)常規(guī)的最新嘗試——這一次,他們分析了能讓一本書領銜《紐約時報》(New York Times)最暢銷小說榜的要素。
什么題材最受歡迎?
The authors find an apparent predominance of violence and fear in those books that climb the US sales charts.No surprise, you might think.Thanks, though, to some devilishly complicated science and a bank of 1,000 computers mining the texts of 1,000 books at a time, a specially written algorithm is able to unearth more unexpected reasons.
這兩位作者發(fā)現(xiàn),在那些進入美國暢銷書排行榜的圖書中,暴力和恐懼明顯占據(jù)主導地位。也許在你看來這不足為奇。然而,在一些極其復雜的科技手段和能同時分析1000部書籍文本的1000臺電腦的幫助下,我們可以通過一個專門編寫的算法挖掘出更多意想不到的原因。
Another insight is that seemingly boring domestic matters—home, work and the “closeness” of everyday relationships—are far more powerful themes than sex, drugs and rock'n'roll.
他們還洞察到,像家庭、工作和日常生活中的親密關系這些看似乏善可陳的家務事,實際上是比性、毒品和搖滾更強有力的主題。
什么樣的人物更“暢銷”?
An everyday style and background in journalism helps, as does a central female character with a mysterious, darker side and a quest for redemption (think Lisbeth Salander in the Stieg Larsson Millennium trilogy or Gone Girl's Amy Dunne and you get the idea).Oh, and it is a bonus if they are a 28-year-old.
日常的風格和新聞從業(yè)背景是加分項,此外,一個有著神秘的陰暗面,并尋求救贖的女性中心角色也更加有利(想一想施蒂格·拉松(Stieg Larsson)的千禧三部曲中的莉絲貝特·薩蘭德(Lisbeth Salander),或者小說《消失的愛人》(Gone Girl)中的埃米·鄧恩(Amy Dunne),你就明白了)。啊,如果她們是28歲還會有額外加分。
The computers are trained to see elements in the texts that human readers would not notice, such as the use of the word “the”, punctuation, nouns, active verbs and whether books are predominantly written from a male or female standpoint.All this is crunched together to produce a 15-page report on each text and a score out of 100.
這些計算機被訓練來探測人類讀者不會注意的文本元素,比如定冠詞“the”、標點、名詞、主動動詞的使用、圖書主要是從男性立場還是女性立場寫作等等。這一切元素都被融合在一起,針對每一份文本生成了一份15頁的報告,并得出一個滿分為100分的分數(shù)。
It found that while best-selling novelists such as John Grisham, Danielle Steele and Dan Brown might be belittled by Horowitz, all display a firm grasp of their art, an ability to move readers emotionally and to connect with a broad audience.
分析發(fā)現(xiàn),盡管約翰·格里沙姆(John Grisham)、丹妮爾·斯蒂爾(Danielle Steele)和丹·布朗等暢銷小說作家可能被霍羅威茨看輕,但他們都展現(xiàn)出對本門絕技的嫻熟掌握,一種從情感上打動讀者,牽動廣大受眾心弦的能力。
值得注意的是,該算法預測《紐約時報》暢銷書的能力達到了80%。
但讀者也許會發(fā)現(xiàn),兩人所稱的“暢銷書計量表”背后的科學很復雜,這意味著他們有時會陷入任何人都能提出的泛泛之論。
他們坦言,他們的發(fā)現(xiàn)并不保證一位作者能夠突然炮制出一部暢銷小說。他們承認計算機也會犯錯。
“發(fā)現(xiàn)模式的問題是,如果你刻意地尋找一種模式,你往往能夠找到。”他們承認。
盡管如此,他們對文學的熱情在這本書里表露無遺,這也是一本發(fā)人深思和有意思的書。和約克爾斯聲稱了如指掌的詹姆斯·喬伊斯(James Joyce)的《尤利西斯》(Ulysses)不同,你不需要花上很長時間就能讀完這本書。說到這里,我在想計算機有沒有對這本書進行全面分析呢?