2022.11.08

研究・教育

サイバー大学と九州大学(総長:石橋 達朗、所在地:福岡市西区元岡744)美馬 秀樹 特任教授、国立研究開発法人情報通信研究機構(NICT(エヌアイシーティー)、理事長:徳田 英幸、所在地:東京都小金井市)は、講義ビデオへの多言語字幕自動付与に関する共同研究を実施します。
講義ビデオ音声コーパスの構築と、それを利用した専門用語辞書の構築、および音声認識モデルのカスタマイズを行うことで、音声認識精度および機械翻訳精度の向上をめざします。大学等の講義ビデオに対し、音声翻訳システムを利用することで、自動的に字幕を挿入するシステムの開発を目標とします。

昨今、場所や時間など個人の環境や条件を問わず学習ができるオンライン教育の需要がますます高まっていますが、教材として講義ビデオを使用する場合、その映像に対して文字情報の付与や適切な編集、内容の提示など、付加的情報をあわせて公開する必要があります。本研究は、まず講義ビデオを対象とした音声認識・自動翻訳システムの研究開発を行い、高精度な多言語字幕を作成可能なシステムを開発することで、講義ビデオの国内外での利用を促進するねらいがあります。

従来の研究では、日本語の講義ビデオ音声を機械的にテキスト化する際、自動生成されたテキストの精度が低く、英語への翻訳を行うことが非常に困難でした。サイバー大学の授業用講義ビデオは、単純に通常の講義を撮影したものとは異なり、専門のスタッフが専用のスタジオで収録し、受講者の視点で視聴に支障のないよう、雑音や言い間違いなどのノイズを除去して編集したものです。高度かつ専門的な内容を扱い、性別や年齢、日本語のイントネーションなどが多様な講師陣による良質な講義ビデオを研究素材として使用することで、AI(人工知能)の音声認識モデルへの機械学習用データ収集を容易にし、音声認識の精度の向上をはかります。

現在本学では、大学の講義ビデオへの自動字幕付与や、海外大学の講義ビデオの自動翻訳および字幕付与の実用化をめざした取り組みを進めています。時間・場所・個人を問わず、教育の機会が提供されることは社会の持続的な発展のために非常に重要です。本研究を通し、国内外の教育コンテンツがいつでも・どこでも・誰でも受講できる環境の実現に貢献してまいります。