ideomics

オブジェクト思考ブロギング

Bibliomics / Epi-bibliomics Studies

Quantitative Analysis of Culture Using Millions of Digitized Books

(PDF版は:PDF


に対する、

(単語や人名の)歴史事象と出現頻度、というくくりでもちろん面白いけど、GWAS*1みたいな感じで語同士の相関とることで背景の文化事象に関連が見えてきたり、どのような歴史・文化的現象ががいかに語の出現頻度を変化させるか・・・を検討したり、色々やりようあるんだろうね。

というK先輩のコメントが面白かった。


東大の強み? - ideomicsでも少し触れたが、現時点だと、とりあえず分析しましたという所で、なかなか「人文的」とは言えないレベルなので、もう少し深めないとなかなか人文系オリジンの人にも興味を持ってもらえそうにはない。「GWASみたいな感じで語同士の相関とる」ってのは、確かに面白そう&意味ありそうだし、まさにアソシエーションスタディ。


細胞におけるDNAという情報記録装置を、人間社会へとアナロジーしていくとすると、我々の社会のDNAというのは何だろうか。それは、本である。というのは、ひとつの解答としてあり得るだろう。優れたアナロジーとは言えないにしても。


細胞生物学的なアナロジーを進めてみる。"DNA=本"とすると、"DNA配列=テクスト"。そこから、"個体=プロテイン"が、情報を読み取り(=転写)し、"思想やアイデア=mRNA"となり、個体のアクション(=プロテイン)の作用によって、"社会=細胞"の動態が変わっていく。そして、、また新たな情報が生み出され、"本=DNA"という形に結晶し、中長期間保存される。"本=DNA"とすると、中でも特に重要な"本=DNA"があって、遺伝学における個々の遺伝子研究のように、それにフォーカスして精緻に分析していくものが、哲学や文学であるとすると、重要性の因子を捨象して、一気に網羅的に分析していくということもありえる。それを、遺伝学におけるgenomicsに倣って、bibliomicsと読んでも差し支えなさそうだ。上の論文に銘打ってあるculturomicsというのは大言壮語過ぎで、記述的にbibliomics(bibli=本 + omics=網羅的体系)としておく方が良さそうなので、以下bibliomicsという言葉を使う。bibliomicsと一口に言っても、テクストの塊(bibliome)をどう選ぶかによって、網羅性や特異性は変わってくるけど。


まずまずのサイズのデータを扱う場合、おそらく、「データ=ゴミで、その中で、たまたま光っているモノを見つけられたら良いな」というのが、基本的な考え方としてなってくる。なので、テクストが溢れてくると、(私の文章のように)基本的にはゴミというのが一般的で、その中からたまたま光っているモノを見つけてくるというテクノロジーやスタンスも大事になってくるような気がする。その対極にあるのは、"カノン"の精読や、神聖な"バイブル"という考え方で、おそらく人文学の中心はそのスタンスであるべきだろうけど。


そして、geneticsに対するepigenticsのアナロジーを進めると、epi-bibliomicsという考え方もありえる*2。epi-bibliomicsを想定するとすると、どんな「エピ修飾」がありえるのだろうか。とりあえずはテクストの収まる形・・・新書とかハードカバーとか電子書籍とかハイパーリンク構造とか・・・・だろうか。"テクスト=ゲノム配列"は一緒でも、"テクストの装丁=エピ修飾"によって、"読まれ方=転写のされ方"が変わるみたいな。このままでは、いわゆるメディア論でしかないけど、これも網羅的にomics的に分析しうるかもしれない。bibliomicsに倣って。電子書籍やWeb上のテクストなど、テクストの媒体が多様になっていくと、場合によっては、テクストそのものよりも、"媒体=エピ修飾"が大事になってくる場合もあるだろう。ちょうど、場合によっては遺伝子配列そのものよりも、エピ修飾の方が大事になることもあるように。


      ***


今見直しみたら、なにげDr.Steven Pinker*3の名前も共著者に入っていて、本人のウェブサイト*4にも紹介されている。この辺りのPinkerの嗅覚というか、あるいはLieberman Aiden達のうまさみたいなのは、羨ましいところだ。