字起こしシステム、音声合成システム、顔画像認識システムなど
NHKの研究開発成果をベースに、技術の普及、啓発、実用化に
取り組んでいます。
Topics
トピックス
技研公開 2025に出展します
5月29日(木)から6月1日(日)までの4日間、NHK放送技術研究所(東京・世田谷区砧)で開催される「技研公開 2025」に、「映像音声連動型8K切り出し視聴」「AI音声合成技術による古文や短歌・俳句の読み上げ」「ネットワーク技術を活用した3次元映像コンテンツ」「NHKが保有する特許・ノウハウの技術移転」の4項目を展示いたします。
なお 「映像音声連動型8K切り出し視聴」 については、5月26日(月)から28日(水)までの3日間、NHK放送センター(東京・渋谷)正面ロビーで開催された「NHK TECH EXPO 2025」においても展示しました。
映像音声連動型8K切り出し視聴
スマホやタブレットを使って、インターネットやローカルネットワークを通じて高解像度な8Kコンテンツを視聴する際に、解像度を落とさずに好きな部分をズームしたりパンしたりできるシステムです。その際、映像のズームやパンに合わせて音のバランスや響きも変化する機能を追加しました。展示では、音楽コンテンツを使ったデモを行います。
特徴
・視聴端末で視聴している領域を含む3つの映像ストリームだけを配信するため、通常のスピードのネットワークでも安定した受信が可能です。
・Webブラウザに標準で実装されている機能を用いるため、スマホやタブレットに特別なアプリのインストールが不要です。
8Kズーム視聴用のタブレットを使った防災授業の記事も、併せてご覧ください。
江戸時代の史料を最先端技術で鮮明に!―8Kでみる安政江戸地震の複合災害― | ステラnet
AI音声合成技術による古文や短歌・俳句の読み上げ
古文や短歌・俳句を、それにふさわしい声質と読み方で読み上げる技術を、デモを交えて紹介します。用途に特化した少量の発話データで、意図した声質や口調を再現する「カスタムボイス音声合成技術」です。
特徴
・10時間以上の発話データで学習済みの既存のモデルを、目標話者の15分~30分程度の少量データで微調整する方式を採用し、低コストでの多様な声の作成を実現しました。
・古文や短歌・俳句などを、それにふさわしい声質と読み方で読み上げることができます。
この技術は、翻刻文※や、新・介護百人一首などの読み上げで、活用されています。
※翻刻文:歴史資料の多くは、「くずし字」で書かれており現代人には読みにくいため、「くずし字」を現代の活字に直し、データとして扱いやすくしたもの。
翻刻文の読み上げについては、ステラnetの下記記事も併せてご覧ください。
AIが語りかける!?防災への思い | ステラnet
8Kで観よう!!『災害の記憶 デジタルミュージアム』が私たちに教えてくれること | ステラnet
新・介護百人一首の読み上げ音声は、下記のwebページで聴くことができます。
「新・介護百人一首2023」で選定された100首を、毎週2首ずつを、ご応募いただいたイラストとともに紹介しています。
https://steranet.jp/list/poems
ネットワーク技術を活用した3次元映像コンテンツ
3次元映像ならではの「奥行き表現」を利用したコンテンツと、その将来のサービスイメージを展示します。ネットワーク技術の一つであるWebSocketを用いて、放送局側からダウンロード型コンテンツを制御しています。
展示では、仮想の山岳レースにおいて、選手がどこを走っているのかを周囲の地形を含めてわかりやすく提示する「北アルプス山岳レース」、奥行き表現を生かした教育用コンテンツ「『何の頭?』クイズ」、「自治体ハザードマップ」の3つのデモをご覧いただきます。
NHK財団では、NHKから業務委託を受けてこの研究開発を進めています。
NHKが保有する特許・ノウハウの技術移転
NHKの技術を広く理解していただくために、NHKが保有する技術の中で技術移転が可能な40項目について、それぞれ2ページにまとめた「NHK技術カタログ」を制作しています。今回は、その中から「光源アレーを用いた3次元ディスプレー」と「白黒映像のカラー化技術」について、実機展示や説明動画を通して紹介します。
NHK財団は、NHKから業務委託を受けて、NHKの研究開発成果の技術移転(ライセンス、技術協力)の窓口を担当しています。
NHKの研究開発成果の技術移転に関しては、ステラnetの下記記事も併せてご覧ください。
NHKの最新技術が詰まった「NHK技術カタログ」2025年版が公開! | ステラnet