メディア芸術におけるデータ流通・メタデータ生成の見取り図――今とこれから、さまざまな立場から

執筆:松尾 奈々絵(一般社団法人マンガナイト)/編集:鈴木 史恵(一般社団法人マンガナイト)/収録:菊池 健/編集:坂本 麻人(Whole Universe)

大向一輝「メディア芸術データベース」

大向 専門はウェブ情報学、人文情報学で、学術情報サービス「CiNii」の開発リーダーを約10年間務めました。「メディア芸術データベース」ではサービス全体のプロデューサーとして、システムの基本設計やユーザーインターフェイスを主に担当しています。

「メディア芸術データベース」はベータ版としてこれまで公開していましたが、2024年1月31日に正式版としてリニューアル公開します(※現在は公開中)。このデータベースでは、メディア芸術(マンガ、アニメーション、ゲーム、メディアアート)それぞれの分野内で検索ができるだけではなく、分野を横断して検索する機能を備えています。メディア芸術は現在多面的な展開をしている作品が多いため、展開されたものが新しい順に並ぶ検索結果を提供できるようになっています。

▼メディア芸術データベース
https://mediaarts-db.artmuseums.go.jp/

大向 それぞれのデータは、各分野の団体や研究機関と連携して収集しています。そのため、メディア芸術データベースは、複数の組織の協力がなければ存在し得ません。それぞれ、特定の目的を持ってデータを整備しているため、データのつくり方などの作成方針も違います。それらのデータを統一的に検索できるようにするには、何に気をつければいいのかを、常に議論しつづけています。

今後のことを考えると、データベースを取り巻く環境は、より複雑化していくと予想しています。一番大きな変化はデジタル化です。制作過程がデジタル化していくだけではなく、配布のされ方、受容のされ方もデジタル化していき、情報の流れが大きく変わっていく中で、これまでのようなデータの整備が続けられるのかは大きな課題となっています。

また、作品自体が複合メディア化されていることも大きな変化の一つでしょう。作品をつくる側も、受容する側も、それが何のメディアであるのかという区別をしなくなってきています。メディアを整理しなければいけないのは、我々のようなデータベースをつくる側だけではないかと意識させられる状況も多くあります。

こういった課題がある中で、メディア芸術データベースのような公共的なデータベースは、何をどこまで整備すべきか、対象をどこまで拡大すべきなのかなど、今日はお話できればと思います。

東海林真之「マンガペディア」

東海林 「マンガペディア」は、小学館のグループ企業であるエイトリンクスが運営しているサービスです。マンガにまつわる産業に役立てるべく、マンガに関わる唯一無二の有用なデータベースを構築することをミッションとしています。主な特徴としては、作品や登場人物を、個別に切り分けたリレーショナルデータベースを構築していることです。

例えば『うる星やつら』を記録する際には、「SF」「ラブコメ」というジャンルに区分しますが、同じSFジャンルやラブコメジャンルの中でもどんな特徴があるのか、あるいは作者の作品のなかでの位置付けや、どんな登場人物が出てくるのかなど、ほかの作品との比較ができるようなテキストをつくり、データ化しています。

ポイントは、書誌データとは異なり、作品の中身のメタデータ化に取り組んでいる点です。一つの作品について、一定のルールに基づいて記述し、校正校閲をして、正しいデータの作成を進めています。

作中に登場する地名やアイテムなどのリレーショナルデータベースをつくる構想もあり、枠組みは用意しているのですが、まだそこまでは手がまわっていません。作品やマンガ家、登場人物のデータ、メタデータをこつこつ増やしているのが現状です。

マンガに関わるデータベースをどのように整えていけるかを試行錯誤しながらつくっているのがマンガペディアです。今お伝えした一部のデータを切り出してWEB上にまとめ、メディア運営もしています。ウェブサイトに出ているのは、我々の活動のあくまで一部ではありますが、見える形で世の中に公開しているので、機会がございましたら覗いてみてください。

マンガペディア
https://mangapedia.com/

蓮沼素子「大仙市アーカイブズ」

蓮沼 「大仙市アーカイブズ」では、秋田県大仙市の公文書の評価選別・管理や地域資料の受け入れ、整理、公開業務、広報普及活動をしています。最近では、電子公文書の導入やそれらの長期保存・アーカイブズ移管に関わる業務も担当しています。

私自身の専門領域はアーカイブズ学とマンガ研究で、2021年に出した博士論文では、「漫画家の活動記録とアーカイブズ管理に関する研究」と題して、マンガ家が活動している中で、作品も含めてどのような記録が制作されて、それらを将来活用できるようにするためには何が必要かということを研究しています。

漫画家の活動記録とアーカイブズ管理に関する研究
https://ci.nii.ac.jp/naid/500001516852

マンガをはじめとするメディア芸術は、成果物としての作品を制作する過程で、さまざまな記録や情報が大量に発生します。現在の国内のメディア芸術のデータベースを考えると、作品一点一点のメタデータ記述が主流で、作品そのもの以外の資料全体の構造を概観できるものがあまりないと思っています。いろいろな扱い方があると思いますが、作品や作家の資料群としての記録情報をどのように管理して、活用できるようにするかが今後の課題ではないかと考えています。

また、マンガ独自とは限らないと思いますが、類似の作品や関連資料をどう記述するのかという問題があります。マンガであれば下書きと原画、掲載雑誌、単行本では同じ作品でも違う媒体のものを、それぞれどのような記述をして、どうリンクすればいいかは、課題の一つだと思っています。

アーカイブズ学の分野では、国際的にデータの記述規則が整理され、世界標準化されてきています。メディア芸術の記録情報の管理・活用にも、そうしたメタデータ標準や新しい概念の構築が必要になると思います。階層構造を含めたアーカイブズの標準を取り入れることは、フレキシブルな検索にも役立つのではないでしょうか。本日は、そうした情報交換もしていければと思います。

溝口敦「MyAnimeList」

溝口 「MyAnimeList」は、メディアドゥが2019年に買収した世界最大級のアニメ・マンガコミュニティです。メディアドゥは電子書籍の取次事業者として、国内では一番大きな会社となっています。「取次」とお話しすると、紙の本の取次をイメージされやすいですが、デジタルの世界でも同じように必要になる業態です。作家や出版社が多く、電子書店の数も多いため、やりとりが煩雑となり、またデジタルといえど、いろいろな細かな調整ごとやマーケティング、工夫しなければいけないことがたくさんあります。この間に入って、作家・出版社・書店、みなさんの負担を最小限にしていくことで、図の一番右にいる読者に届く作品の流通量を最大にしていくのが生業です。

メディアドゥ傘下で私が代表を務める「MyAnimeList」では、この「読者」を海外にまで広めていきたいという思いを強く思っています。MyAnimeListは日本のアニメ・マンガのデータベース・コミュニティですが、英語のサービスのため、利用者の99.9パーセントが海外です。日本のユーザーは1パーセントもいない状態で、アクティブユーザーは今1800万人くらい。世界のほぼすべての国と地域からご利用いただいています。

溝口 「タイトルページ」と呼んでいる、作品ごとのデータベースの入り口にあたるページでは、それがどういう作品なのか、他の作品との関連やキャラクターの情報等をメタ情報として載せていて、最後にユーザーのレビューも掲載されています。

メタデータはウィキペディアのようにつくられています。世界中のユーザーが投稿して集まった情報を、同じく世界中にいる約60名の協力モデレーターが内容の正しさを判断して、反映していく形です。データベースそのものがユーザーの手でつくられていき、そのデータでユーザーがどれくらい楽しんでいるのか、どれくらい盛り上がっているのかによって、「スコア」などが表示されます。いろいろなフォーラムやユーザー同士のコミュニケーションを楽しめる機能もあります。世界で最大級のデータベース&コミュニケーションサービスです。

ユーザー分布としては、アメリカの次にインドネシアやインドが続きます。ヨーロッパではシェアは低く、それよりは英語で楽しめるアジア圏での利用が多いようです。性別では男性のほうが多いですが、最近は女性の利用者も増えてきています。

作品のスコアは時系列で記録があるので、どのタイミングでどれくらいの人気があったのかを管理側では見ることができます。どのエピソードがユーザーに反響があったのかがわかるので、アニメの制作会社さんから興味深い数字だと言っていただくこともあります。

ータをつくるうえでの、ステークホルダーとのコミュニケーション

大向 2つのテーマについてみなさんにお伺いします。まず、データのつくり方について。データをつくったり調査研究をしていくうえで、ステークホルダーの方々と、常日頃、どういうコミュニケーションをとっているのでしょうか。品質を維持するための努力や、人の育成をどうするのかという視点もあると思います。

次に、デジタル化によって生まれてくる新しいメディアを理解し、それに基づいた新しいデータをつくっていく必要がある中で、今後どういう対応をしていくべきか。新しく人を巻き込んでいくにはどうしたらいいかなど、ご意見をお伺いできればと思います。

東海林 我々は非常に少人数、かつ人力で作業しています。具体的にいうと、一桁の人数のライターさんを編集プロダクションの方に管理していただき、それとは別に校正校閲チームを設けています。マンガに詳しい方に実際に読んでもらったうえでテキスト化しメタデータをつくることにこだわっています。

また、必ず校正校閲の手を入れる二段階をかけてつくっているので、量産は難しいという課題はありますが、この7年くらいはその体制でこつこつ続けてきました。ウィキペディアとの差別化の意味もありますし、データベースとしてデータの価値の信頼度を保って、データの提供や販売をしていきたいというのが最初から思っているところなので、そのクオリティは落とさないようにと考えています。

蓮沼 以前、チャールズ・M・シュルツのミュージアムでお話を伺ったアーキビストの方は、もともとアーカイブズ学を学んでアーキビストになったが、シュルツのミュージアムに就職したのは偶然で、入ってからマンガの勉強を始めたと聞きました。マンガに特化したアーキビストはいないので、メタデータにどのように情報を反映していくべきかの基準がない、という課題はあると考えています。

今後の担い手をどう育成していくのかという問題にも関わってきますし、それには現在の私たちアーキビストがどう関わり、情報を持っている人たちにどうアクセスしていくかが重要なのかなと思っています。特にマンガ家さん個人の記録については、できればご存命のうちに、記録に対してのいろいろな情報を付与していただくと、大変助かるなと思っています。

博士論文でお世話になった矢口高雄先生には、整理を始める最初の頃に、資料の残し方などについてのお考えをお伺いしました。原画の整理とのリンクをどうするのかを、横手市増田まんが美術館と相談しながら検討できたのもよかったです。アーカイブズ側だけでは、なかなか記述しきれない部分があると思うので、そうしたステークホルダーみなさんと情報を共有したうえで、それらの情報をメタデータ化していくことが大事だと考えています。

溝口 MyAnimeListは、先ほど説明したとおり、世界中のユーザーの集合知でできているデータベースなので、データをつくる素材を集める仕組みはできています。ただ、それを反映する立場であるモデレーターの存在がデータの信頼性を保つうえで最後の砦になるので、そういう方の育成や確保が非常に大切だと思っています。卒業される方も多いので、どうやって継いでいくかは今後の課題です。

我々の組織でおもしろい点は、モデレーターを選ぶのもモデレーターであるということ。モデレーターの運用そのものを当人たちに委ねています。我々は、活動がやりやすくなるように、モデレーションがより効率よく動くように、仕組み・仕掛けをサポートする立場です。その構造を今後もつつがなく動かしていくことが大事だと思っています。世界中のユーザーたちと向き合っていく必要があるというところが、おもしろくもあり、難しいところですね。

これからのデータベースの話でいうと、対応言語が英語だけでいいのかという点が挙げられます。日本のコンテンツを世界に届けていくには、英語以外の言語にも対応しているほうが、当然広がる確率は高まります。その際に、どの言語に対応するのか、人力でやるのか、機械でやるのかは、ポイントとしてあるのではないかと。いずれにしても、MyAnimeListだけでも現在25万作品ほどのデータが登録されていて、これからも増え続けることを考えると、多言語対応はAIのようなものに頼るのが効率のよい道の一つだと考えています。先ほどお話しした人力によるモデレーションの部分と、AIによる効率化の部分をミックスしていくことが、データベースをより豊かにしていくことにつながりますし、より多くの海外のユーザーへ日本のコンテンツを届けていくことにもつながるのでは、と考えているところです。

マンガやアニメーションのデータは特別?

大向 最後に、マンガやアニメーションのデータは特別なものなのか、という点をお伺いします。特定の分野での研究をしていれば、それぞれ分野固有の様相をもっているのは当然ではありますが、マンガやアニメーションだけに存在するもの、一見特別のように見えてほかの分野でも同じものなど、共通性と固有性を理解していけると、データ整備が進んでいくのではないかと考えています。

東海林 私見になってしまいますが、日本の強みといえる分野であるという意味では特別だと思います。一方で同じ「コンテンツ」という意味では、文芸や書籍、それ以外にも広がりのある分野なので、あまり特別視せず同じ構造を使って、ほかの分野のデータも含めて整備していければいいと思います。

受賞歴や雑誌掲載情報など、メタデータとなるファクトの情報を業界全体でどう整えていくのかも課題としてありつつ、作品の概要のようにさまざまな書き方ができてしまうものに関しても、なるべく構造化して、横比較できるようにアーカイブしていきたいです。そのためにはどうしたらいいのかを検討していけるといいと思っています。マンガやアニメの分野は、頑張れば規定できるのではないかと。

蓮沼 記述する項目自体はほかのアーカイブズ資料と共通化できると思いますが、内容やコンテンツをどう記述するのかが課題だと思っています。公文書や地域資料の場合は記述しやすいのですが、マンガの場合は全部読まないと概要が書けなかったり、登場人物やその関係性をどうリンクさせるのかも含めて、メタデータをどう紐づけるのかが難しい。加えて、マンガやアニメのデータはユーザー数やニーズも公文書等とは大きく異なります。アーカイブズの検索手段は、利用者のニーズにいかに答えられるかが重要で、それをメタデータに反映させていくには、項目は一緒でも記述すべき内容が違ってくる。これが格段にこの分野のデータ整備を難しくしている要素だと思います。まずはいろいろな機関でもっているデータ同士を比較できるようにマニュアル化できれば、平均的にメタデータ記述ができるようになるのではないでしょうか。それにプラスして各機関が追加したい項目を個別に記述していけば、大量のメタデータの記述ができるようになるのかなと、みなさんのお話を聞きながら感じました。

資料の種類の問題としては、下書き・原画・雑誌・単行本の違いの話をしましたが、例えば写真資料でも、同じアングルで何連写もされていて似たような写真がたくさんある中で、「作品」になっている1枚があったりします。そう思うと、資料の種類については、マンガに特化した問題ではないなとも思っていて。写真でも、そうした類似の写真をどう結びつけていくのか、メタデータも含めて、どう記述して管理するのかは課題になっている。そういう意味では共通性もあるかと思います。異なる分野同士でも問題を共有して、一緒に解決していく必要があるのではないかと思いました。

溝口 マンガには、まずタイトルがあり、そのなかに巻情報、さらにその中に話数の情報と、一つのタイトルに対してコンテンツの階層がありますよね。こういうメディアは珍しいように思いますし、その紐付きをデータベース化していくのは、それだけでも複雑な作業です。かつ、マンガの場合は「愛蔵版」のような、同じ作品でも違った版が存在することもあるので、そのデータがどの版に基づいているのかが特定されている必要がある、というような特殊性もあるのかなと思います。さらに、アニメやゲームがつくられたり、映画化されたりと、リレーションしていく先が非常に多い。どんどん掘っていける構造なので、リレーショナルデータベースの仕様書がすぐに大変なことになるのは、この分野特有の現象かもしれませんね。データベースをつくる人たちにとっては、とても刺激的な分野だと思います。

大向 分野の垣根を越えて横でつながっていくことが、データのつながり、情報のつながりを生み、問題を解決していくことにもなりそうですね。そうしたことを実現していければいいなと思います。みなさま、本日はさまざまな見方を提供してくださりありがとうございました。

※詳細の議論は動画をご覧ください
※URLは2024年2月10日にリンクを確認済み

登壇者プロフィール(敬称略)
大向 一輝(おおむかい・いっき)
2005年総合研究大学院大学複合科学研究科博士後期課程修了。博士(情報学)。同年国立情報学研究所助手、2007年同助教、2009年同准教授を経て、2019年東京大学大学院人文社会系研究科准教授、現在に至る。ウェブ情報学、人文情報学、学術コミュニケーションの研究開発に携わる。2004年情報処理推進機構「未踏ソフトウェア創造事業」スーパークリエータ認定。2020年「学術情報サービス基盤CiNiiの開発」により文部科学大臣表彰・科学技術賞(開発部門)受賞。著書に『ウェブがわかる本』(岩波書店)、『ウェブらしさを考える本』(丸善出版)がある。
https://dh.l.u-tokyo.ac.jp/i2k

東海林 真之(しょうじ・まさゆき)
マンガペディア事業運営責任者。現在、小学館の完全子会社エイトリンクスにおいて、マンガペディアをはじめとした複数サービスの事業運営責任者を務める。2007年に野村総合研究所コンサルティング事業本部に入社。2010年および2013年に会社を創業。創業した株式会社リグネが2020年に小学館グループとなり、現在はリグネ社の代表取締役、兼、エイトリンクス社のコンテンツ開発部部長。IP作品の価値の最大化をミッションとして活動。
https://mangapedia.com/

蓮沼 素子(はすぬま・もとこ)
宮城県公文書館、江東区公文書等専門員などを経て、現職。国立歴史民俗博物館共同研究員。藤沢市公文書等管理委員会委員(2016年11月~)、岩沼市史収集資料保存活用等検討会委員(2021年11月~2023年3月)などを歴任。博士(アーカイブズ学)。専門はアーカイブズ学、マンガ研究。研究では主に漫画家の活動記録の管理と活用について、矢口高雄・清家雪子などを事例に漫画家アーカイブズの実践的な研究を進めている。そのほか、沖縄県伊江島における阿波根昌鴻資料調査会や沖縄市の比嘉アトリエにおける比嘉康雄アーカイブズ調査チームなど、地域に所在しているアーカイブズ資料の保存・活用に関する活動に参加している。
https://www.city.daisen.lg.jp/docs/2014040200045/
https://www.rekihaku.ac.jp/archive/001/member/

溝口 敦(みぞぐち・あつし)
2000年NTTドコモ入社。iモード上でのコンテンツ流通事業の企画開発に携わる。2008年メディアドゥ入社。2010年執行役員、2017年取締役グループCOOなどを歴任し、2023年3月より取締役 CROに就任。
2019年よりグループ会社MyAnimeList代表取締役に就任(現職)。電子書籍流通や新規事業などに従事した幅広い経験、ITやモバイル通信に関する知見を活かし、国内外のコンテンツ流通拡大や新規事業創出を担う

関連人物

Media Arts Current Contentsのロゴ