雑誌記事索引集成データベース ざっさくプラス 総合雑誌から地方紙まで、明治から現在まで雑誌記事索引集成データベース ざっさくプラス 総合雑誌から地方紙まで、明治から現在まで

検索記事
総数
20世紀メディア情報DB連携時31,354,641
20世紀メディア情報DB非連携時29,389,744

お知らせ

J-STAGEデータを実装します。

7月14日のお知らせの通り、国会図書館に申請をし、許諾を得ました。
これより、J-STAGEの方から順次搭載を開始します。
雑誌記事索引のほうは、もう少し手続きに時間を要しますが
こちらも年内には搭載を完了します。
搭載が完了しますと、20世紀メディア情報データベース連携時には2000万以上から検索が出来るようになります。

2016/7/14 データについて

「ざっさくプラス」では、連携検索するCiNiiにNDLデータが搭載されているため、重複を避ける意味で、2014年からNDLデータの実装を中止してきましたが、実装の要望も強く、NDLでハーベスト用API・OAI-PMHが提供されることから、データをハーベストして再度実装することにいたしました。
また、連携検索を開始する「20世紀メディア情報データベース」は、科学技術情報なども豊富なため、その方面の占領期以降のデータを充実させる意味で、 J-STAGEのデータもハーベストして実装することにしました。
この件に関しては、NDLに申請して許可を得ることが必要なので、実装はNDLの許可が下りてからになります。
これらにより、「20世紀メディア情報データベース」との連携時には、2000万件を超えるデータから検索が可能になります。

2016/5/9 20thメディア情報DB(プランゲ文庫)と連携検索

5月6日、NPO法人インテリジェンス研究所(代表・山本武利先生)と20世紀メディア情報データベースとざっさくプラスとの連携検索についての覚書を交換。
今後、1945年(敗戦時)からNDLが雑誌記事索引採録を開始する1948年9月までの空白期を含め占領期の検索が格段に強化される。

詳しくは後日発表。

11/24 「地方史文献年鑑」2013を登録しました。

タイトルと同じ。

2015.11.12 図書館総合展のフォーラムで話したこと

戦後70年-雑誌記事検索の現在
  敗戦を起点として

 本日は、私どもの「ざっさくプラス」についてお話するわけですが、データベースの宣伝をするというよりは、「ざっさくプラス」を始めて10年の私どもが、いま何を考えているか、これからどうしようとしているのか、試行錯誤の中で考えて いることをお話して、ご参集の専門家や利用者の方々のご意見やご要望を承り今後どのようにしていくか考える材料にしていきたいと考えています。

「ざっさくプラス」立ち上げのきっかけ 

 私どもがこのデータベースを、作るきっかけになった話については既に[みんなの図書館」などに書かせていただいたので、詳述は避けますが、簡単に言えば水野広徳(1875.5-1945.10) という、戦前期の軍縮・平和論者の著作集をつくろうとして、国会図書館の雑誌記事索引も民間の雑誌記事索引データベースも全く役に立たなかったことに始ま ります。我が国の記事索引は、国会図書館が昭和23年9月から作成を開始したので、これをもとにして作られた後発のデータベースも、多かれ少なかれその制 約の中にあります。すなわち、当時は、戦前期の雑誌記事を検索するツールがなかったのです。私たちはそのため、戦前期の雑誌記事目録類を集めて全120冊に及ぶ『明治・大正・昭和前期 雑誌記事索引集成』を作りました。今から20年前です。

GHQの勧告で作成された国会図書館の「雑誌記事索引」

 なぜ、国会図書館の「雑誌記事索引」が昭和23年からかということは、単に国会図書館の開館が昭和23年からということではなく(これも国会図書館自体がGHQの勧告で作られたわけで、関係あるわけですが)、『国会図書館五十年史』によりますと「「雑誌記事索引」は、昭和23年7月の(GHQの)ダウンズ報告書に盛り込まれた勧告に基づき、昭和24年2月に第1巻第1号(昭和23年9月受け入れ分)が刊行された」とあるように、占領下GHQの勧告によって作成が開始されました。
 このフォーラムのタイトルが「敗戦を起点として」とあるのはそういう意味で、「雑誌記事索引」は、わが国独自というか主体のもとに開始されたのではなく、敗戦によってもたらされたものの一つなわけです。
 7月に勧告を受け、9月納本分から作成し、翌年2月には刊行という、十分な準備もなく始まった『雑誌記事索引』ですから、出版物を国会図書館に納本する「納本制度」もまだ十分に機能しなかったと思いますし、滑り出しから順調でなかったことは十分に予想されます。
この点、国内発行のすべての出版物を検閲のために提出させたGHQの方がより網羅的に集まっていました。ですから、GHQが敗戦直後からの出版物を検閲のために集めたプランゲ文庫(メリーランド大学)の記事索引である「20世紀メディア情報データベース」(敗戦-1951.9をカバー)は初期の国会図書館の「雑誌記事索引」を補うものとして重要不可欠なものだと考えます。

戦前になかった「雑誌記事索引」

 「雑誌記事索引」が敗戦によってGHQの勧告でできたものだとすれば、戦前期には「雑誌記事索引」というものはなかったのかということになります。
 確かに、現在、神戸大学から刊行されている『国民経済雑誌』や後藤新平による満鉄調査部や東京市政調査会の『都市問題』の巻末の目録類、筑波藤麿が刊行した『昭和○年の国史学界』のようなものは、戦前期からむしろ豊かにあります。 
 しかし、「記事目録」は、目録作成者の価値判断や時代の制約を免れないのに対し、「記事索引」はその判断をせず、利用者に任せることが前提となります。
そうすると、実は、『雑誌記事索引集成』に採録した目録類はあくまで「記事目録」というべきものであって「記事索引」とは異なるのではないでしょうか。(本稿では、「記事索引」と「記事目録」を区別したいと思います)

「雑誌記事索引」と「雑誌記事目録」を区別 

 このことは、実は、『雑誌記事索引集成』をデータベース化することで戦前期の「雑誌記事索引」が出来るのではないかと考えて始めた作業ですが、作業を進めるに従い(『雑誌記事索引集成』ばかりでなく)、個々の雑誌の総目次を採録していく中で気づいたことであります。
 例えば、『雑誌記事索引集成』では見つけることができなかったけれど、データベースを作成し、雑誌を選ばずその総目次を追加していく中で、「國學院雑誌」「神社協会雑誌」「新青年」等にも水野の文章 が掲載されていることがわかりました。軍縮を主張する水野は「政治」「外交」「時事」をテーマにした目録に採録されていましたが、これらの雑誌はそのテー マから外れているし、そもそも「新青年」は目録の採録対象雑誌ではなかったのです。
 また、関東大震災の混乱の中で無政府主義者・ 大杉栄が憲兵大尉・甘粕正彦に虐殺された「甘粕事件」では「婦人公論」が「甘粕といふ人間批判」という特集を組み、新居格、三宅雪嶺、高島米峰、広津和郎 などが寄稿しています。「婦人之友」は「甘粕事件の感想」として、上司小剣、吉屋信子、内田魯庵、吉野作造等の寄稿を掲載しています。これらは、同時代の 総合雑誌にもない企画でこの記事により、同時代の知識人がこの事件をどう見ていたかが分かる貴重な記録です。婦人雑誌おそるべしで、今後婦人雑誌の資料価値が大きく変わるかもしれません。
 このように、国会図書館の「雑誌記事索引」でカバーされていない、それ以前の記事を広く深く探すには、戦前の「記事目録」を「集成」して代用できるものではなく、新しく遡及作成する必要があるのです。
 つまり、目録をいくら集めても目録を超える発見はないということです。

 二種類の「雑誌記事索引」データベース・プロデューサー

 現在「雑誌記事索引」データベースの作成者、データベース・プロデューサーは大きく分けて、原資料を所蔵するものと、しないものに分けることができると思います。
 所蔵するものの代表は国会図書館で、大宅壮一文庫などもこれに入ります。マイクロフィルムをもとにデータを作成している「20世紀メディア情報データベース」も変則的ながらこちらに分類されるでしょう。
所蔵しないものは、CiNiiや日外アソシエーツのマガジンプラスなどが代表で、私どもの「ざっさくプラス」もこちらに分類されます。

国会図書館の姿勢

 私どもは、以前『明治・大正・昭和前期 雑誌 記事索引集成』を刊行し、このデータベース化を考えながら、とても完成させる力はないと考えて、国会図書館に「権利とか一切主張しないから、この『集成』 を使って国の力で戦前期も検索できるデータベース」を作ってくれませんかとお願いしたことがあります。たしか、2000年前後のことだったと思います。担当者のお答えが、個人的見解か国会図書館の公式見解かは知りませんが、こういうお答えでした。
 「国会図書館の雑誌記事索引は、所蔵する雑誌 について利用者の便を図るために作成している。したがってこうした目録からデータを作成すると所蔵していない雑誌の記事もヒットしてしまう。(これはまず いということですね)また、二次資料からデータを作ることは精度に問題がある(二次資料の間違いを踏襲してしまう)」
 その時は、聞き逃したのですが、ここに資料を所蔵する機関の本音があると思います。つまり、資料を所蔵する機関作成のデータベースは、所蔵資料のメタデータを作ることで自己完結するのです。所蔵しないタイトルや雑誌の欠号についてのデータは持つ必要がないわけです。
 そのことが、欠号の補充や所蔵しないタイトルの補充に消極的な姿勢に繋がらなければよいと思っています。

採録雑誌の見直し

 もう一つ国会図書館の場合、「採録雑誌の見直し」ということと、「採録基準」という問題があります。採録雑誌の見直しということが行われることによって、連続性が途切れるということがあります。
例えば「婦人公論」の場合、1948年9月から採録を開始し1958年9月で 中断、採録を再開するのは40年近く多々1996年7月からになります。「ざっさくプラス」は、戦前期のデータとともに、この中断期のデータを作成して搭載していますから、「婦人公論」の創刊から直近まで検索できる唯一のデータベースということになります。「ざっさくプラス」は国会図書館の採録中断期や中 途再録開始の創刊号からの補充も一つの役割と考えています。

採録基準

 国会図書館の採録基準では、たとえばグラビヤページは採らないとか、「3ページ以下の記事は採録しない」などがあります。
 短い「彙報」や「消息」ページに重要な情報が 掲載されていることは、資料探しをした経験を持つ人は誰でもご存知でしょう。グラビヤページも同じです。日本近代文学館は、近代の作家や詩人の肖像などの 写真のレンタルサービスをしていますが、その多くは所蔵雑誌のグラビヤページを複製したものです。
 そうした点、独自のキーワードを付与するなど 細かなデータ作りをしている、大宅壮一文庫さんや記事のタイトルに小見出しも含めることによって、検索の精度向上をはかっている「20世紀メディア情報データベース」の方向は注目されます。所蔵する強みは、現物を見て検索精度の向上を図る工夫ができる天にあります。また、国会図書館がデジタル化に伴い原資料の閲覧ができなくなっているのに対し、原資料に触れることのできる大宅文庫や近代文学館などの存在意義は長期的には増していくのではないかと思っています。

所蔵雑誌を持たないデータベース

 では、所蔵雑誌を持たない我々はどうしたらいいのかという問題になります。所蔵する雑誌に限ってデータを作成するという限定もできず、分野を限った専門データベースではないので、刊行された全ての雑誌が対象といえば対象です。どれ一誌として搭載しない理由はありません。
 しかし、過去の出版物ですから理屈の上では有限ですが、実質的には無限に近くあり、散逸したものも多いと考えられます。また実物を持たないわけですからデータ化の原稿が必要になります。したがってデータは原稿に左右されます。
 その指針として、天野敬太郎の『雑誌総目次索 引集覧』(昭和41年)と、それを継承する『日本雑誌目次要覧』があります。これらは、雑誌の総目次のリストです。これをデータ化してコンピュータで検索するだけでも大変な進歩です。しかし、それは膨大な数になりこれをことごとくデータ化するには十年単位の時間が必要になるでしょう。もう少し絞り込みたい。それで現在は、せめて全ての復刻された雑誌の目次だけでも網羅したいと考えています。
 復刻がなされるということは、それだけその雑誌が重要視されていると言えるでしょう。しかし、復刻によっては、総目次のないものもあり、雑誌の記事へのナビゲートがなければ、せっかく復刻されても死蔵されかねません。そういう意味では、復刻出版社に目次データをご提供いただき、データベースに搭載すれば復刻資料の活用をも促し、双方の利益になると思うのです が、復刻出版社の理解を得るのはなかなか困難です。再度独自に目次データを作っているのが現状です。
 このように、原資料を持たないデータベースのデータは、自ずから広く浅くとならざるを得ません。
 またその他の試みとして、某文学館にその文学館しか持っていない雑誌の目次コピーを提供してもらい、こちらでデータ化を行い、作成したデータはデータベースに搭載させていただくとともに、文学館に無償で提供するというご提案をしたことがあります。これは、当方のデータベースの充実と同時に、文学館でも所蔵の稀覯雑誌の記事索引を構築できる一石二鳥だと思ったのですが、理解を得られませんでした。また復刻出版社にしても文学館にしても、長期的に見ればウイン・ウインの関係が築けると思うのですが現状はうまくいっていません。

今後の方向

今後、データベース全体としては、検索結果から一次資料へ遷移という方向にあることは間違いないと思います。しかし、これは我々には事実上無理だと言えます。(ただまれに、当方の手元にしかない雑誌が偶然あった場合、誌面をデジタル化して実装したいと思います。現在準備しているのは、『みくに』という雑誌で、これは戦時中、特異なキリスト教雑誌として発行されたものですが、現在、大学等にも所蔵はほとんどありません)
今後の方向としては、できるだけ多様なデータベースとそれぞれ独立を保ちつつ、API(Application Program Interface)などシステムによって連携し、利用者の便を図りたいと考えています。

国立情報研究所のCiNiiとの連携

国立情報学研究所のCiNiiとは、このデータベースのごく初期から連携検索を実施しています。CiNiiはシステム連携のためのAPIを提供していますので、この機能を利用して連携検索を行っています。また、CiNiiは、国会図書館の「雑誌記事索引」データを搭載していますので、「ざっさくプラス」では、重複する「雑誌記事索引」のデータ搭載を2014年から中止しています。その分を独自データの充実に注力する事にいたしました。

国会図書館のデジタルコレクション

 国会図書館のデジタルコレクションは、メタデータのハーベストを許可しています。このメタデータの検索結果から、本文情報への「永続的識別子」も公開されています。
国会図書館の雑誌のメタデータの構造は、書籍と同じ一冊単位になって いますので、検索は記事単位でなくその雑誌のすべての目次を対象に行われます。したがって、ともすると 期待値と違った結果が出てしまいます。  たとえば「川端康成 伊豆の踊子」で検索した場合の期待値は「川端康成の書いた伊豆の踊 子という作品」あるいは「川端康成 の伊豆の踊子についての記事」ですが、NDL の検索システムでは「目次」を対象としているために、ある雑誌の目次全体のなかに「川端康成」「伊豆の踊子」の単語が文字通り含まれてさえいれば、当該の 雑誌が検索結果に出てきてしまうのです(言い換えれば、たとえその雑誌が「川端康成の書いた伊豆の踊子という作品」や「川端康成の『伊豆の踊子』についての記事」を扱っていなくても検索にヒットしてしまうのです) 上記の構造のため、詳細検索で検索するときは、二つの検索語を「目次」に入れなければな り ません。タイトル欄に「伊豆の踊り子」を入れても、著者欄に「川端康成」を入れても記事は一件もヒットしません。検索結果に表れるのであれば、それはタイ トルが「伊豆の踊子」で著者が「川端康成」という雑誌でなければならないのです。
また、メタデータの中にあまりに簡略すぎて検索ができないものがあります。
そこで、ざっさくプラスでは、NDLデジタルコレクションの雑誌部分のうち、まず請求記号が「雑」で始まる雑誌のメタデー タを順次ハーベストして、記事単位で検索できるように改造しています。
「映画と演芸」など簡略すぎるメタデータは独自にデータを作成していきます。これ に、公開されている永続的識別子を付与しますので、詳細画面は、デジタルコレクションの誌面のページに遷移します。著作権処理が終わって公開のステータスが「国立国会図書館内限定」から「図書館送信資料」「インターネット公開」と推移するにしたがって一般 の図書館やインターネットで本文を読むことができるようになります。

20世紀メディア情報データベース

 既述の「20世紀メディア情報データベース」は、国会図書館が「雑誌記事索引」を作成する以前の、1945年(敗戦)以降、講和条約迄の間をカバーするデータベースですが、その網羅性において「雑誌記事索引」の空白期を補う貴重なデータベースですので、現在、連携をお願いして具体化に向けて詰めに入るところです。
 このように、今後のデータベース・サービスの在り方を巡っては様々な努力を惜しまず、あくまでも利用者の便を第一に考えていくつもりです。

 個人的な心配

図書館の内部事情は知りませんが、外部から見る限り、数値目標を追うことに汲々としすぎていないでしょうか?
 来館者数の増加が図書館の最大の課題のようにも見えます。貸出数とか蔵書回転率など、これが問題になるなら図書館がベストセラーを買いたくなるのは当然です。数値目標がひとり歩きすると、数値化されにくい蔵書の構成や質は置き去りにされないでしょうか。
またこれに加えて、業務の電子化や出納の自動化などによって合理化が進むと、司書や図書館職員の仕事が、パートやアルバイト、派遣労働などの短期で安い労働力に置き換えられ、時間をかけて労働の質や熟練に取り組むことができにくくなります。その結果、労働の満足が損なわれ、古い言葉ですが「労働の疎外」が起きてはいないでしょうか。熟練労働力が「出征」によって不足したあとを「労働の希釈化」によって年少労働や婦人労働に置き換えようとしたのが戦時中だとすれば、今は何を何に置き換えようとしているのでしょうか。
加えて、大学の管理化が進み、学問の自由は尊重されず、権力があの学問は有用、この学問は不要と口を出しています。
 我々の仕事も、知らず知らずのうちにこの流れに組み込まれていないか、形を変えた「いつかきた道」をたどっている不安を感じます。