令和4年度 報告会・実施報告書「クレジット情報テキスト識別の更なる高精度化とメタデータ処理の汎用化」一般社団法人 日本アニメーター・演出協会

令和4年度メディア芸術連携基盤等整備推進事業 報告会が、2023年2月20日(月)にウェブ会議システムZoomにて開催されました。メディア芸術連携基盤等整備推進事業では、産・学・館(官)の連携・協力により、メディア芸術の分野・領域を横断して一体的に課題解決に取り組むとともに、所蔵情報等の整備及び各研究機関等におけるメディア芸術作品のアーカイブ化を支援しています。また、アーカイブ化した作品・資料等を活用した展示の実施に係る手法等を開発・検討することにより、貴重な作品・資料等の鑑賞機会の創出を図っています。本事業の実施を通じて、アーカイブ及びキュレーションの実践の場の提供や今後のメディア芸術の作品等の収集・保存・活用を担う専門人材の育成に寄与することを企図しています。報告会では、本事業の一環として実施した五つの分野別強化事業の取り組みの主旨や進捗状況の報告、メディア芸術連携基盤等整備推進事業の事務局調査研究及びメディア芸術データベース等に係る調査研究事業に関する報告がなされ、有識者検討委員からの質疑や助言が加えられました。本稿ではそのうちの「クレジット情報テキスト識別の更なる高精度化とメタデータ処理の汎用化」を取り上げます。

報告者:一般社団法人 日本アニメーター・演出協会 事務局長 大坪英之

事業の概要

日本はアニメ大国であるが、作品数が膨大な上に関与するスタッフの数も多いことから、正確なデータを把握するのが難しい状況である。そこで、本事業では平成29年度から、日本アニメーター・演出協会とアニメ特撮アーカイブ機構、リスト制作委員会が協力して、関東広域圏で受信可能なテレビアニメ作品を録画し、作品の一覧の作成やスタッフ情報の自動的なデータ化を行っている。昨年度までの成果として、録画したアニメ番組からクレジット画面を選び出し、OCRを使って文字情報を抽出した上でメタデータとして記録する作業を自動化する仕組みを構築した。さらにクレジット画面の文字識別機能の向上や、メタデータ処理の汎用化にも取り組んでいる。

実施内容と成果

本事業におけるクレジットデータの収集については、ある程度のめどがついたため、今年度は昨年開発した文字識別機能の高精度化、システムの再配布化、メタデータ処理の自動化、周知活動など五つの活動を行った。

まず、①「クレジット情報テキスト識別のさらなる高精度化」として、OCRを利用した類似業務等を調査したが、アニメのクレジット画面は他のサービスとは類似度が低く、既存の技術を短期間や低コストで適用するのは難しいことがわかった。そこで、昨年同様に再度「Google Cloud Vision」を採用し、アニメ作品クレジットの独特な段組みの解析を進めた。また、機械学習・深層学習の環境を整備できる「Google Colaboratory」を利用し、軽量化・高速化できるモジュールづくりにも取り組んでいる。Googleの両サービスを利用することで、全ての処理を人が行った場合と比べて大幅なコスト減が可能となった。

次に②「システムの配布可能化の準備」、③「メタデータ処理の汎用化の試行」として、データセットの自動生成システムの構築及び確定した文字を属性で色分けするAIモデルの作成にも取り組んだ。この作業を行えば、テレビアニメのシリーズが終わっていなくても、続けてオンエアされた新規の話数に対して自動的にメタデータ、各項目の属性が付いていくことになる。アニメ作品の場合、クレジットのレイアウトは作品ごとに一定のパターンがあるが、このパターンを学習させることで、新しくオンエアされる回でも高い精度で属性を把握できるようになった。ただし、初動のデータセット構築のための作業労力やハードウェアの負担が重くなる点は課題と言える。

また、④「アニメ作品情報を採録する意義についての周知活動」を今年度の新たな試みとして実施した。ファン向けには「マチ★アソビ」、アニメ業界向けには「JAniCAチャンネル」での配信と連絡調整会の開催、学術向けには「コミケットフリンジ」などで講演を行った。

さらに、産業界とのつながりをつくることを目的とした⑤「アニメ作品情報連絡調整会(仮称)」の組成準備も進めている。アニメ業界には、団体、放送事業者、制作会社などを網羅的に組織する団体がないため、一社ずつデータ提供依頼を行う必要があるが、現実的に難しい面があり、アニメ作品情報連絡調整会という場を設けて参加してもらうかたちを考えた。

今後の課題

今後の課題としては、全録サーバの安定的な継続稼働、メタデータ処理のシステム実装、アナログ映像素材へのOCRの適用、連絡調整会の本格稼働、周知活動の継続的な実施があげられる。

大坪英之氏

実施報告書(PDF)

このテーマに関連した記事

Media Arts Current Contentsのロゴ