雑誌記事索引集成データベース ざっさくプラス 総合雑誌から地方紙まで、明治から現在まで雑誌記事索引集成データベース ざっさくプラス 総合雑誌から地方紙まで、明治から現在まで

検索記事
総数
20世紀メディア情報DB連携時31,277,375
20世紀メディア情報DB非連携時29,312,478

お知らせ

9/29 戦後のデータは辞書は要らない。

簡易・詳細検索共にCiNii連携データは辞書オフにしました。

当データベースに搭載データの検索は簡易検索時は必ずオン、詳細検索は任意で選択します。
したがって、詳細検索で辞書オンにしても、辞書は当DBのデータのみに展開され、CiNii側には辞書オフのデータで連携しています。

【簡易検索】
戦前・地方などの本DB独自データ(辞書ON)+ CiNii(辞書OFF)
【詳細検索】
戦前・地方などの本DB独自データ(辞書ON,OFF選択)+ CiNii(辞書OFF)

9/29 辞書の問題。

「中国東北」など、検索した場合、極端に検索結果が多いケースがあります。

当DBでは、「中国=支那」という辞書を作っています。したがって、「中国東北」では、まず辞書展開され「(中国 OR 支那) 東北」となります。

当DB側では、これは「中国東北 OR 支那東北」と解釈されますが、CiNii側では「中国 OR 支那 OR 東北」と解釈されてしまうようです。つまり、「中国」一般、「支那」一般、「(日本の)東北」も含めてヒットしてしまいます。
その為、「中国東北」で検索すると、極端に件数が増えてしまっています。

これを修正するには、CiNii連携&辞書利用時に「(中国 OR 支那) 東北」と展開せずに、「中国東北 OR 支那東北」として展開すればいいのですが、辞書が再起構造(入れ子)になっているケースが多く、すぐに対応が困難です。

今後の対応としては、辞書の入れ子を見直すか、CiNii連携時は辞書を利用しないか、のどちらかになると思います。

とりあえず、CiNii連携時は辞書を「OFF」にして検索してください。

【追伸】CiNiiには、「辞書」を使わないことで「解決」です。
戦後のデータは、表記のぶれも少なく戦前期ほど重要ではないということで。(NDL「雑索」もCiNiiも実装していません)
したがって、「辞書」については従来どおりの使い方をしてください。




9/25 NDLデータの重複

お詫びと言い訳です。

本DBは、戦後期に関してはNDLデータのご提供を受けて、そのまま搭載していました。データに重複があることは承知していましたが、ある時期(1950~60年代?)においては相当な量になることが、CiNiiとの連携検索をした結果判明しました。

連携検索では当DBのNDLデータをはずし、CiNiiのNDLデータを使います。

雑誌記事索引集成DB独自データ + NDLデータ(NIIにおいて重複を処理) + CiNii独自データ

したがって、検索結果は〔 当DB単独≦連携検索 〕となるはずですが、〔 当DB単独>連携検索 〕というケースが少なからずあり、しかも相当大きい場合があることがわかりました。
これについて、精査の結果、開きの多少にかかわらず、原因は、当DBのNDLデータの重複とわかりました。
極端な例では、火野葦平の「三味線横丁」という作品はCiNii連携を「利用する」で検索すると1件検索されますが、「利用しない」で検索すると同じものが6件ヒットしてしまいます。

したがって、当DBのデータは、少なからず水増しがあったことになります。「言い訳」としては、NDLからご提供を受けていたものをそのまま搭載したわけですが、お詫びいたします。

またその意味でも、当DB単独の検索より、CiNiiとの連携検索のほうが有効ということになります。




9/24 CiiNiiとの検索連携

9月24日から、一度で「雑誌記事索引データベース」と「CiNii」を検索できるようになりました。
二つのデータベースに重複して搭載されている、NDLの「雑誌記事索引」データのうち、片方を検索対象からはずして検索するので結果が重複しません。

すでに検討したように(8/15 本欄)、現在、邦文の雑誌記事検索データベースは、WebOYA-bunko(大宅壮一文庫雑誌記事索引)などを除いて、国立国会図書館の「雑誌記事索引」データを取込んでいます。
過去の自己完結的なデータベースでは問題ありませんが、現在のように、特徴のある複数のデータベースが出揃った環境では、それぞれのデータベースを組み合わせた検索結果から目的の情報を求めることになります。各データベースを引き比べた場合、「雑誌記事索引」のデータはすべてのデータベースに重複して検出されてしまい、重複を除去する作業が必要になります。

そこで、国立情報学研究所のご了解を頂き、雑誌記事索引集成データベースを外部インターフェイスとして、CiNiiとの連携検索を実現しました。

これによって、一度で雑誌記事索引データベースとCiNiiを検索・表示します。
このとき、両方に取込まれた国立国会図書館の雑誌記事索引データのうち、片方(雑誌記事索引データベース)を検索対象からはずして検索します。したがって、検索結果はほぼすべてユニークなものとなります。

検索結果の一覧表示では、「雑誌記事索引データベース」(主として戦前・地方)の検索結果、CiNiiの検索結果(主として戦後)の順に表示されます。CiNiの検索結果は、論題冒頭に「CiNii」と表示され、CiNiiの詳細画面にリンクします。したがって、WebCatPlusによる書誌・所蔵情報や原文リンクその他CiNiiの機能がそのまま利用できます。
(CiNiiに関しては、検索についてバーチャルに連携していますが、すべてのサービスは国立情報学研究所から提供されます)

このデータベースでは、デフォルトでCiNiiとの連携検索が選択されていますが、実装しているデータのみで検索することも選択できます。【追記】デフォルトでは、実装データから検索します。CiNiiとの連携検索は、「利用する」を選択してください。

CiNiiとの連携検索より実装データの検索結果のほうが多くなるケースがありますが、実装データのうちNDLデータの重複が原因です。したがって重複を除いたユニークな検索結果は〈 連携検索結果≧実装データ検索結果 〉となります。
(それ以外のデータ(主として戦前期)は、出典を異にして重複するケースがあります。これについての対応は検討中です。9/2 本欄参照)



9/19 NDLでデジタル化される雑誌リスト

国立国会図書館においてデジタル化される予定の雑誌リストが公開されている。このリストにあげられたもののうち、2000年までに刊行された雑誌をデジタル化さすると言う。

http://www.ndl.go.jp/jp/aboutus/digitization_consult.html

ざっと見て、21700タイトル、そのうち戦前期は4~5000くらいか?
(請求記号で「雑○‐○」が4000タイトル)
また、「なお、今回の候補リストに掲げている雑誌は、原資料を保存するためにその代替物としてデジタル化を行うもので、権利者の許諾なくインターネットで提供することはありません」ということだ。