雑誌記事索引集成データベース ざっさくプラス 総合雑誌から地方紙まで、明治から現在まで雑誌記事索引集成データベース ざっさくプラス 総合雑誌から地方紙まで、明治から現在まで

検索記事
総数
20世紀メディア情報DB連携時29,389,744
20世紀メディア情報DB非連携時29,389,744

お知らせ

9/24 CiiNiiとの検索連携

9月24日から、一度で「雑誌記事索引データベース」と「CiNii」を検索できるようになりました。
二つのデータベースに重複して搭載されている、NDLの「雑誌記事索引」データのうち、片方を検索対象からはずして検索するので結果が重複しません。

すでに検討したように(8/15 本欄)、現在、邦文の雑誌記事検索データベースは、WebOYA-bunko(大宅壮一文庫雑誌記事索引)などを除いて、国立国会図書館の「雑誌記事索引」データを取込んでいます。
過去の自己完結的なデータベースでは問題ありませんが、現在のように、特徴のある複数のデータベースが出揃った環境では、それぞれのデータベースを組み合わせた検索結果から目的の情報を求めることになります。各データベースを引き比べた場合、「雑誌記事索引」のデータはすべてのデータベースに重複して検出されてしまい、重複を除去する作業が必要になります。

そこで、国立情報学研究所のご了解を頂き、雑誌記事索引集成データベースを外部インターフェイスとして、CiNiiとの連携検索を実現しました。

これによって、一度で雑誌記事索引データベースとCiNiiを検索・表示します。
このとき、両方に取込まれた国立国会図書館の雑誌記事索引データのうち、片方(雑誌記事索引データベース)を検索対象からはずして検索します。したがって、検索結果はほぼすべてユニークなものとなります。

検索結果の一覧表示では、「雑誌記事索引データベース」(主として戦前・地方)の検索結果、CiNiiの検索結果(主として戦後)の順に表示されます。CiNiの検索結果は、論題冒頭に「CiNii」と表示され、CiNiiの詳細画面にリンクします。したがって、WebCatPlusによる書誌・所蔵情報や原文リンクその他CiNiiの機能がそのまま利用できます。
(CiNiiに関しては、検索についてバーチャルに連携していますが、すべてのサービスは国立情報学研究所から提供されます)

このデータベースでは、デフォルトでCiNiiとの連携検索が選択されていますが、実装しているデータのみで検索することも選択できます。【追記】デフォルトでは、実装データから検索します。CiNiiとの連携検索は、「利用する」を選択してください。

CiNiiとの連携検索より実装データの検索結果のほうが多くなるケースがありますが、実装データのうちNDLデータの重複が原因です。したがって重複を除いたユニークな検索結果は〈 連携検索結果≧実装データ検索結果 〉となります。
(それ以外のデータ(主として戦前期)は、出典を異にして重複するケースがあります。これについての対応は検討中です。9/2 本欄参照)



9/19 NDLでデジタル化される雑誌リスト

国立国会図書館においてデジタル化される予定の雑誌リストが公開されている。このリストにあげられたもののうち、2000年までに刊行された雑誌をデジタル化さすると言う。

http://www.ndl.go.jp/jp/aboutus/digitization_consult.html

ざっと見て、21700タイトル、そのうち戦前期は4~5000くらいか?
(請求記号で「雑○‐○」が4000タイトル)
また、「なお、今回の候補リストに掲げている雑誌は、原資料を保存するためにその代替物としてデジタル化を行うもので、権利者の許諾なくインターネットで提供することはありません」ということだ。

9/7 雑誌「新青年」

今でこそ、大学での研究対象になっている「新青年」とその作家たちだが、当時の地位は意外に低かったらしい。
現在、「新青年」の記事として登録されているのはたったの10件。そのうち出典を見ると6件までが「宝塚文藝図書館報」で、そのほとんどが映画関係の記事である。残りの4件は、戦後の「文学年表」類から採録したものだ。
このデータベースは、同時代の国文学関係の幾種もの目録が搭載されているが、それらの目録からは、完全に無視されていたといっていい。雑誌そのものが採録対象外である。

現在、新青年の総目次を準備中だが、これが搭載されると「新青年」の記事は一挙に5000件を超える。

9/2 本日。

ある大学の図書館員さんの研修の一環として、データベースの説明に伺った。
小生は、二桁の人の前で話す機会は、めったに無いのであがってしまってしどろもどろだった。酒席なら元気がいいんだけれど。

いろいろ手厳しくも暖かなご指摘をいただいた。やはり、よりよいものにしていくには、ご注文やご指摘が一番ありがたい。

ちょっと前、ここでNDLデータのダブりを問題にしていたが、本データベースのダブりの処理を本格的に考えなくてはならない時がきたようだ。

このデータベースは、戦前期の雑誌記事を検索可能にするため、先人の黙々とした努力の結晶であって、しかも埋もれているものの多い目録類をデータベース化することで、再び活用することを目的に作られた。
二次文献を基に作っているので、目録自体の持つ限界(誤りや記述の不統一、不備)に影響されるという弱点を持つ。
また、複数の目録、総目次などを搭載しているので、データのダブりがある。しかし、出典となった目録の性格や採録された目録の数も重要な情報を含むので、当面、ダブりは整理しない方針だった。

しかし、利用者にとって相当にわずらわしいというご意見だった。
同じ論題が3本あった場合、1つ残して2つを削除すると、出典情報は失われる。削除ではなく統合しなくてはならない。手作業ではいつ追いつくかわからない。うまい方法、あるいはストレスの無い見せ方は無いだろうか。

休憩に入って、「あのDB好きよ。出典もあるし」と囁いてくれたお姐さんがいた。その後姿に後光が射していたのであった。



8/15 無駄。

本日現在で、邦文雑誌の記事データベースである、CiNiiと本データベース、某商用データベースのデータ量を比べると、

CiNii          1234万件
本データベース   1127万件
某データベース   1080万件

である。見かけ上はなかなか壮観と言える。
しかし、この三者とも、NDLの「雑索」のデータ、895万件を取込んでいる。ということは、それぞれの正味は、

CiNii          339万件
本データベース   232万件
某データベース   185万件

ということになる。つまり、みんな「張子の虎」である。といえば、そうなのだが、NDLのデータが異常に多いのであって200万前後の独自データというのは決して少ない数ではないのである。
さらに、CiNiiと某DBはともに戦後が検索対象(CiNiiは一部戦前にさかのぼる)である。
CiNiiはもちろん、某DBも学協会誌や年報類を独自に補充してきたとしているので、この二つの間にも相当な重複があると思われる。(本DBの部分は、主として戦前と地方なので重複は少ない)
利用者は、それぞれのデータベースを引き比べるとき、組み合わせによって少ないもので7~8割、多ければ9割以上の同じデータを検索しなくてはならない。

利用者の立場に立てば、腹立たしいくらいばかばかしい。
課題である。