リポジトリ運動

昨夜、毎月開催されている勉強会に慶應義塾大学メディアセンターから入江伸さんを招いて講演をしていただきました。今回は大学図書館におけるリポジトリ運動についてのご講演でした。

機関リポジトリの歩み

門外漢なので、背景知識が足りず、講演会当日は10%程度の理解でした。ネットで検索をし、リポジトリー運動が、外国雑誌の高騰による雑誌の危機に根差すもので、それへの対処として国内の図書館がコンソーシアムを組み価格交渉力を身につけるとともに、海外出版社の独占状況を解決する目的で国内雑誌を保護育成することが求められた時代があったということを理解しました。

2003: SPARC Japan運動。*3
2004: NIIリポジトリ
2005/10: CSI (Cyber Science Infrastructure)*4の開始
2007/2/8-9: DRF第2回ワークショップ機関リポジトリをデザインする−設計とコンテンツ

入江さんのお話のなかから、

(ここに書いたのは入江さんが話されたことのうち、私が理解した部分のそれも一部です。なんだ、つまらないところしか聞いていないんだなとお笑い下さい。)

リポジトリに何を求めるかということでいろいろの目的が考えられるようですね。研究成果の交換と公開、海外出版社への価格交渉力の向上、研究成果の発表の場、各大学の広報、などなど。基本的に、よりよい資源をよりたくさん提供することで、このいずれの目的をも満すことができると思われますが、一方で財源が制約されたときに、どこに集中的に投資するかという判断を求められます。このために、いくつかの目的を切る過程で摩擦が生じるのかもしれません。

入江さんはお話しのなかでいくつかの比較をなさっていました。(法人化後の)国立大学 vs 私立大学、理系 vs 文系、研究大学 vs 教育大学。国立大学と私立大学の違いとしては、資金を獲得する力の違いを強調なさっていました。その理由として、従来は事務系組織が中心となって運営していた図書館機能を役員会を中心とした運営に移行し、それとともに事務組織と教員組織が協調するようになった点を挙げておられます。入江さんによれば、国立大学の研究者の強力な資金獲得能力によってリポジトリの継続的な運営が可能になっているということです。また、教員との距離が狭まった図書館職員(とくに若い世代)は新しい仕事の場を得て生き生きと仕事をしているということです。*5

理科系と文化系の比較では、発表の場の違いから紀要を重視する文化系と学外に発表の場を求める理系とでリポジトリに対する感覚が異なるということでした。勉強会の場で、数少ない理系として、また文系のウェイトが小さい理工系の大学の身からは、普段、あまり考えない視点でした。わたしが所属する専攻ではテクニカルレポートの小さなリポジトリを運営しています。テクニカルレポートを研究発表の場として考えている人はいないのですが、ソフトウェアのマニュアル、投稿中の論文のプレプリントを公開する上で、一定の役割を果しています。テクニカルレポートの出版日は発明や発見の日についての根拠ともなります。すでにデジタル化されたテクニカルレポートの日付が学外での信頼を得られるのかという点はやや不安です。

最後に研究大学と教育大学との対立点は、国立大学法人化後に大学の差別化が進みそういう傾向がはっきりとしつつあるということなのですが、その結果、各大学が提供できるコンテンツの内容について大学間の体力の差が見えてきたということのようです。

ここまではほんのさわりで、入江さんの主張はここからが本番なのですが、わたしの理解は十分ではないので、ここでやめておきます。

ちょっと考えたこと

入江さんのお話しと前後して、わたしのパソコンに一通のメールが届きました。前日、わたしがコーネル大学で稼動している物理系のリポジトリシステムプレプリントを投稿したのですが、それが掲載されたという連絡です。このリポジトリシステムというのは、物理、数学、計算機科学、非線形科学、計量生物学の分野の文献を収集しています。計算機科学の分野ではあまり馴染みがないのですが、物理学の分野では雑誌に投稿する時点でここにも投稿しておくことが習慣化しているようです。投稿すると、論文の脇に日付とプレプリントのIDが刷り込まれます。さらに、PDF版ではそのプレプリントのIDがプレプリントサーバ上のアブストラクトにリンクしています。この仕組みで論文の真贋も判別できるようになっているようです。

入江さんの話のあとでしたので、ほかの方との雑談のなかでこの話について紹介したのですが、そこで思いがけないことに気づきました。わたしが利用したリポジトリの説明によれば、それが稼動したのは、1991年8月にロスアラモス国立研究所でのことだそうです。この1991という年はまさにCERNの技術者であったTim Berners-LeeがWorld Wide Webを発表した年にあたります。つまり、科学技術論文のアーカイブがWWWの最初のアプリケーションといえるのです。

CERN--WWW--アーカイブというのは決して、偶然の一致ではありません。CERNはそこに滞在する研究者が生みだす大量の科学技術論文を整理し、それを世界中の研究者と共有する方法について長年、頭を悩ませていました。WWWが登場する前から、CERNはCERNDOCという文献データベースを運用していました。CERNDOCは非常に優秀な検索機能を持っていたということですが、それを利用するためにはCERNに遠隔ログインしなくてはならず、日常的に使うには煩雑な作業が求められました。この状況を打破したのが、Berners-LeeのWWWだったわけですから、その発表とともに科学技術論文アーカイブがWWWに接続されるというのは、ある意味で自然のなりゆきだったのでしょう。

入江さんの話をうかがっている間は、インターネット → 学術研究のデジタル化 → デジタル配信 → デジタル・アーカイブという流れのような気でいたのですが、実はデジタル・アーカイブ起爆剤となってインターネットが生まれたと考えてもよいのかもしれません。

*1:雑誌の危機(Serials Crisis)1989年から1999年の間に、逐次刊行物の価格はおよそ200%上昇し、国内の外国雑誌は4万タイトルをピークに2.5万タイトルへと激減した。

*2:現在、Dspaceシステムはオープンソース化され、ソフトウェアを自由に利用することができるようです。

*3:SPARC Japan: 雑誌の危機への対抗策として、コンソーシアム交渉活動とともに海外出版社の独占化を緩和するために国内出版社の育成し価格コントロール力を目指した運動。2001年8月に米国SPARC (Scholarly Publishing and Academic Resources Coalition)からの呼びかけに答える形で、発足した。

*4:大学・研究機関等が有している設備、基盤ソフトウェア、学術コンテンツ、学術データベース、人材、研究グループを超高速ネットワーク上で共有する最先端学術情報基盤

*5:昨日は慶應の図書館員がずいぶんおいでになってましたが、みなさん活発に見えました。