NEWS
10/19 「映画と演芸」という雑誌。
雑誌『映画と演芸』の目次情報を独自に作成して、NDLのデジタルコレクションの永続的識別子を付与してアップしたので引き比べてみてください。
粒度に問題のあるメタデータは、感覚的には3割くらいあるので、これをみんな作り直すことは容易ではないけれど、それをしないとせっかくNDLが麻生内閣のばらまき予算でデジタル化した雑誌の紙面データが活用できない。
紙面のインターネット公開は著作権処理の問題で相当時間がかかると予想されるのでそれまでには何とかしたいものだ。

たとえば
NDLの2巻8号のメタデータは下記のごとし。

寫眞
梅村蓉子/表紙
三色版
二色版
映畵/p9~28,44
演藝/p33~43
記事/p29

それに対し弊社作成のデータは。

〈特別増大エスバルト紙グラヴュア版〉梅村蓉子///
〈三色版〉帝劇「太平記曦鎧」//3/
〈三色版〉アルバトロス「覆面の女」//5/
〈二色版〉メトロゴールドウィン「ヴィナスの戯れ」//4/
〈二色版〉松竹座「世響太鼓功」//6/
〈二色版〉歌舞伎座「江戸育お祭佐七」//7/
〈二色版〉松竹座「象牙の塔」//8/
〈映畫〉最近のアグネス・エアース//9/
〈映畫〉フォックス映畫アイアン・ホース、トム・ミックス//10/
〈映畫〉ファスト・ナショナル映畫ロスト・ウアルド―「結婚の渦巻」//11/
〈映畫〉歐州映畫佛パテ社映畫「ヴィドック」獨ネプチュン映畫「裏町の怪老窟」ラシェル・デヴィリのヨランド、エミル・ヴォチェのヴィドック妻//12/
〈映畫〉過ぎ行く影(佛アルバトロス)//13/
〈映畫〉メトロ・ゴールドヰン映畫「拒否」―「暗黑」―「歡樂の不夜城」//14/
〈映畫〉ジャックリン・ローガン//15/
〈映畫〉松竹蒲田映畫「象牙の塔」―鈴木傳明の紳士と英百合子の令孃―「郊外の家」//16/
〈映畫〉「悲しき戀の幻想」奈良眞養の多加磨、栗島澄子の比那女、東榮子の淸女//17/
〈映畫〉帝キネ映畫「大自然の叫び」澤蘭子の八重子、里見明の若者。―「長脇差」尾上紋十郎の業平新太郎、瀨川路三郎の小櫻源藏「稻妻小僧」市川百々助の義賊東京子のお絲―「流るゝ酒」松本泰輔の父―嵐德太郎の一子//18/
〈映畫〉東亞映畫「虹を追ふて」草野辰巳の松三、夏川靜江のお靜、佐々木積の農夫「亂刀」月形龍之助の宇都美信二郎、生野初子の琴師//19/
〈映畫〉獨逸ウフア映畫「クリームヒルトの復讎」マーガレット・シェン、名優ルドルフ・クラインロゲ。獨逸ウエスティ映畫「黃金の犢」ボルテン主演//20/
〈映畫〉「笛吹きマンロ」―「サイド・ショウオブ・ライフ」//21/
〈映畫〉メトロ映畫「人生の異端者」プリンシパル映畫「さびしき燈臺守」//23/
〈映畫〉日活映畫(其一)「母校の爲に」―「闇の中の顔」―「鞍馬天狗」//24/
〈映畫〉日活映畫(其二)「愛に輝く女性」―お雪とお糸」//25/
〈映畫〉映畫批評家列傳(森岩雄君)マキノ映畫「討幕の叫び」//26/
〈映畫〉ユニバアサル映畫「私が案内しませう」―「シージ」―ガムブ現はる。//27/
〈映畫〉表情研究―英百合子。寫眞お手の筋判斷(出雲美樹子)//28/
〈映畫〉海外映畫界ニュウス「おそろしい帽子」―チャップリン―上山草人―ノーマ・タルマッヂ―ライテル・ウィンザー―ダグラスとメエリー//44/
〈演藝〉「色彩間刈豆」菊五郎の累と勘彌の與右衛門//33/
〈演藝〉帝劇七月女優劇(其一)松助―幸四郎―嘉久子―綠牡丹//34/
〈演藝〉帝劇七月女優劇(其二)「出勤時間」―「恐るべきは女なり」「己れラヂオめ!」//35/
〈演藝〉歌舞伎座七月狂言「四谷怪談」―左團次―芝鶴―松蔦「お祭左七」―羽左衛門―梅幸―市藏//36/
〈演藝〉東京各座七月狂言築地小劇塲「牧場の花嫁」―「母の愛」―「休みの日」、公園劇塲―「有馬の猫」井上正夫、訥子//38/
〈演藝〉七月の松竹座「毛谷村六助」―「鎌倉三代記」―「河内山」―「世響音太鼓功」//39/
〈演藝〉市村座七月狂言「夜討曾我」―「繪本太功記」//40/
〈演藝〉菊五郎―勘彌―福助//41/
〈演藝〉大阪中座、浪花座七月狂言「曾我廼家五郎劇」―「新聲劇」//42/
〈演藝〉「新四谷怪談」―「榛名の仇討」//43/
映畫は大衆に何を與ふべきか/森岩雄/29/
マッチの棒と口紅/田中榮三/29/
歐洲映畫往來/淸水千代太/29/
映畫演技のテンポ(三)/關野嘉雄/29/
電影界無線電/立花高四郎/30/
喜劇役者は疲る/人見直善/30/
今秋の映畫戰/北澤秀一/31/
新しき玩具/大島十九郎/31/
海外映畫漫談/靜生/31/
私のエキストラ・ワーク(三)/近藤經一/32/
分芝居/岡田八千代/45/
菊五郎の女形/田村道美/45/
各座の盆興行/幻花/45/
梨園茶話/水谷幻花/46/
劇雅堂斷片/鳥居淸忠/46/
四谷怪談の印象/島村民七/47/
新しき舞踊の題材(二)/永田龍雄/47/
クロス・ワードの新題と當選者發表//47/
六月中封切映畫一覽表―七月各座狂言と役割一覽表―讀者と記者欄



10/8 大津の竹内重弘さん
映画雑誌・書籍のコレクターの竹内重弘さんが昨日亡くなられた。
竹内さんとは、生前から『日本映画雑誌目次集成』を作ろうと約束し、海外の研究者からも期待が高かったが、とうとう生前に実現することはできなかった。
ご冥福をお祈りするとともに、必ず約束を果たすと改めて誓う。
(2013年9月1日日経新聞参照)



9/9 ざっさくアネックス
下記の実証実験にどなたでも参加していただき、ご意見をいただくため、完全無料の検索システム「ざっさくアネックス」を立ち上げました。
ざっさくプラスに搭載すると同時に、NDL デジタルコレクションの「改造」データを搭載していきます。

http://zassaku-annex.com/

どなたでもシステムを検索していただき、ご意見をたまわれば幸甚です。
現在、約30万レコードですが、一年以内に350万件くらいになる予定です。

もとになるシステムは次のURL(NDL デジタルコレクション 雑誌)です。

http://dl.ndl.go.jp/#magazines

検索を比較して感想やご意見をたまわれば、幸いです。


【9月12日追記】

①ざっさくアネックス搭載のデータは、すべて、ざっさくプラスにも搭載されております。つまりざっさくプラス内の「デジタルコレクション由来データの検索」だけを独立させたものが、アネックスです。

②ざっさくアネックスは、無料の登録制です。IP認証、またはID/PW認証です。
お申し込み画面や利用案内等まだ作成中ですが、先に検索システムができましたので、ここで公開のご報告をいたします。
(使い方はざっさくプラスと同じです)

登録ご希望(個人でも機関でも)の方は、

zassaku-annex★libro-koseisha.co.jp(★を@にしてください)

に、利用希望の旨、ご一報ください。
必ず、

①返信用メールアドレス
②お名前、ご所属
③希望認証方法(IP認証希望のかたはIPアドレスも)

を明記してくださいませ。
進捗は、このページでご報告いたします。
ご協力をいただくことが出来れば幸いです。


8/25 雑で始まる請求記号
NDLのデジタルコレクション(雑誌)のうち、請求記号が「雑」で始まる約3000タイトルについて、ハーベストして実証実験することを申請したのですが、最初、有償提供については課金するということで、当面100タイトルのみを実験的に許可するということでした。

100タイトルばかりでは実験にならないのでどうしたものかと思っていたら、本日、当初の3000タイトルについてハーベストして実装する許可が出ました。3000タイトル16万冊のメタデータが実装可能になります。一冊20行として、320万件となります。
ただ粒度の粗いメタデータは、その度合いにおいて追加したり、新しく作ります(新しく作っても永続的識別子は雑誌一冊単位なので本文のデジタルデータに遷移します)ので、その分は増加する計算です。

この実装が完了したら、請求番号がZで始まるもののうち、創刊が戦前にさかのぼるものについて申請を行う予定です。




7/16 実証実験
ようやく正式に申請が認められたので、NDLデジタルコレクションのメタデータを使って実証実験を開始します。有償データベースの場合、メタデータのハーベストは有料になるとのことですが、NDL側の準備が整わないので今回は限定的なタイトル数での実験になります。


 NDLのデジタルコレクションの雑誌のメタデータの構造は、書籍と同じ一冊単位になって います。

検索は記事単位でなくその雑誌のすべての目次を対象に行われます。したがって、ともすると 期待値と違った結果が出てしまいます。

 たとえば「川端康成 伊豆の踊子」で検索した場合の期待値は「川端康成の書いた伊豆の踊 子という作品」あるいは「川端康成 の伊豆の踊子についての記事」ですが、NDL の検索システムでは「目次」を対象としているために、ある雑誌の目次全体のなかに「川端康 成」「伊豆の踊子」の単語が文字通り含まれてさえいれば、当該の 雑誌が検索結果に出てきてしまうのです(言い換えれば、たとえその雑誌が「川 端康成の書いた伊豆の踊子という作品」や「川端康成の『伊豆の踊子』について の記事」を扱っていなくても検索にヒットしてしまうのです)。

 上記の構造のため、詳細検索で検索するときは、二つの検索語を「目次」に入れなければな り ません。タイトル欄に「伊豆の踊り子」を入れても、著者欄に「川端康成」を入れても記事は一件もヒットしません。検索結果に表れるのであれば、それはタイ トルが「伊豆の踊子」で著者が「川端康成」という雑誌でなければならないのです。

また、メタデータの中にあまりに簡略すぎて検索ができないものがあります(例「映画と演芸」など)。

 そこで、ざっさくプラスでは、NDLデジタルコレクションの雑誌部分のうち、まず請求記 号が「雑」で始まる(旧・帝国図書館所蔵) 雑誌のメタデー タを順次ハーベストして、記事単位で検索できるように改造します。「映画と演芸」など簡略すぎるメタデータは独自にデータを作成していきます。

 詳細画面は、デジタルコレクションに遷移するので、著作権処理が終わって公開のステータ スが「国立国会図書館内限定」から「図書館送信資料」「インターネット公開」と推移するにしたがって一般 の図書館やインターネットで本文を読むことができるようになります。


【2014 Demonstration Experiment】
 In NDL(National Diet Library) Digital Collection, metadata for periodicals consist of periodical’s volume, as well as the metadata for books. And the database of search engine is based on periodical’s indexes, not on articles. Therefore sometimes it happens that the search shows different result from what you are looking for.

For example, when you put terms “川端康成 伊豆の踊り子” in search box and start searching, the expected value would be a work titled “伊 豆の踊り子”, that is written by川端康成, or articles about 川端康成’s work 『伊豆の踊り子』. However, since the database is based on periodical’s indexes, regardless of contents or relation between those terms, any periodical could appear in search result as long as those two terms “伊豆の踊り子” and “川端康成” are literally included in its whole index (in other words, any periodical could hit even if it has nothing to do with 川 端康成’s『伊豆の踊り子』or articles about it).

Under such database structure, in advanced search, you have to put those terms in “index” box to find articles. No periodicals would hit if you put “伊豆の踊り子” in title or “川端康成” in author box. If there were a hit, that periodical would have to be titled “伊豆 の踊り子” and its author would have to be “川 端康成”. In addition, some data are difficult to find in this database if the term is too simple (ex. 「映画と演芸 (movie and performing arts)」)

Hence, in Zassaku Plus, by harvesting the NDL Digital Collection’s metadata for periodicals, which starts successively from ones with the reference code begin with 「雑」and formerly owned by Imperial Library, it enables to provide article-based search. Also, by making original dataset, it will deal with the problem of “too simple” metadata such as 「映画と演芸」.

Since detail of results links to NDL Digital Collection, periodicals whose copyright were cleared will be available at public library or online depending on its publication status, which shifts from “Available only at the NDL” to “Available only at the NDL and partner libraries” and to “Available Online”.