RPGの固定会話からの脱出。プレイヤーごとの自動生成音声で自然な会話が可能な未来が!?【CEDEC2021】

RPGの固定会話からの脱出。プレイヤーごとの自動生成音声で自然な会話が可能な未来が!?【CEDEC2021】

Subscribers:
1,290
Published on ● Video Link: https://www.youtube.com/watch?v=KalXrhzL_HE



Duration: 2:22
2 views
0


コンピュータエンターテインメント開発に携わる人たちのための日本最大規模のカンファレンスCEDEC2021(2021年8月24日(火)~26日(木)開催)。多くの著名人による興味深い数多くのセッションが行われた本イベントの中から、8月24日に行われた“学習ベースの自然な音声合成技術のキャラクターボイスの応用と実運用”についてここでお伝えしていこう。

 このセッションでテーマとなったのは、“ゲームで求められる自然な声”。過去から現在に至るまでの音声合成技術の歴史、要件とともに、実際に実装するための手法などが解説された。

 お話いただいたのは、2004年よりデジタルゲームにおける人工知能の開発・研究に携わり、数々の著書や受賞歴もあるスクウェア・エニックスの三宅陽一郎氏と、aiboや二足歩行ロボットQRIOなどの開発ののちに音声対話技術の企画開発業務に携わっている東芝デジタルソリューションズ倉田宜典氏のおふたりだ。

目次閉じる

音声合成の必要性。ゲーム性を深めるために今後は当たり前のものに!?高いクオリティーが要求されるゲーム業界固定メッセージからの開放。AIによる音声合成でよりリッチな音声会話が可能に!?楽器的な意味でのシンセサイザー部分の性能はほぼ人間並に音声合成のプロセス、まずは最重要ポイントの”声の素”まるでオウム? 抑揚の表現における新手法、”韻律射影(いんりつしゃえい)”AI化により流れが加速し、手作業から効率化、高品質に

音声合成の必要性。ゲーム性を深めるために今後は当たり前のものに!?

 まず、三宅氏から、音声合成における歴史、需要、そして音声合成におけるレベルについてお話があった。

 なお、三宅氏が務めるスクウェア・エニックス AI&アーツ アルケミーは自然言語会話を用いた対話によるエンターテインメントAIを目指した研究開発が日々行われている。ゲームのCG技術とAI技術を融合し、ゲームに限らずキャラクターの会話、世の中で広く用いられるエンターテイメントAIをテーマに研究を重ね、ゲーム産業が培ってきた技術を多方面において貢献できるよう、切磋琢磨されているとのこと。

 音声合成における歴史において三宅氏は、音声合成は長らくゲーム産業では使われてこなかった経緯があるが、これからのフューチャーワークとして必須の技術となってきているという。

 「音声合成はやはりゲーム産業では使われてこなかった経緯がある。ライターさんが脚本を書いて、声優さんが収録して、収録した音声を再生するということを長い期間、ゲームが立ち上がったころからやってきた。ところがAI技術の発展によって、セリフや応答がその場で作られるよう変化してきている。それに伴って、音声もその場で生成したいという要望が生まれており、音声合成に注目が集まっている。要するに、その場で作られた会話を音声で出したいと。もちろん決められた会話は録音して使えるが、ユーザーによる行動を拾ってそれに対する応答をしたいとか、新しい文章を発生させたいということで、音声合成はこれからフューチャーワークとして必須の技術となっている」(三宅氏)

 さらに多様性、変性の多い開発現場においてコストを含めた柔軟な対応が行える利点も挙げている。

 「開発はつねに変化していくことが多いため、音声収録後において、ここを変えたい、こういうことを言わせたいということが生まれ、開発後期に取り直すことは必ずしも珍しいことではありませんでした。ただ、状況によっては拡張のセリフに対応できない場合は諦めるということもあったかと思います。そういった収録に依存せずにゲーム開発の柔軟なキャラクターの発声を行いたいというところで、セリフを拡張する意味でも音声合成を導入したいという流れになってきている。

 さらに、ユーザーがもっている固有の情報、たとえば4分53秒に洞窟に潜っているといった情報をしゃべらせることによって、ユーザーは自分のことを理解してくれている、臨場感のある、単にプログラムされた会話ではなく、いまこの場にいるキャラクターを認識して話しているんだという臨場感、没入感が得られる。ゲームの奥行きを生ませるため、音声合成が必要とされてきている。ゲームデザインを広げていくためにも、この技術は基幹技術だと捉える人たちが増えている」(三宅氏)

高いクオリティーが要求されるゲーム業界

 ただ一方で三宅氏は、ゲーム業界において求められるクオリティーは高く、自身で音声合成におけるレベルを5段階で表している。

 「音声合成は最近になってゲーム産業でも取り入れようという流れはあるのですが、ゲーム業界が求めているクオリティーというのは、他産業よりもおそらく高い。というのも、キャラクターが単にアナウンスとか駅のホームのインフォメーションではなく、個性を持ったリアリティーをもたないといけないという面が出てくる」(三宅氏)

レベル1:ロボティックな声ではない、違和感がないという点がクリアーされる必要があり、最低限のクオリティー。レベル2:ファンタジーであればファンタジー、SFであればさらにその中から中世だとか近未来だとかゲーム固有の世界観がありますので、その世界になじめる。レベル3:ほかのキャラクターが入ったときに流れを壊す声ではない。ほかのキャラクターは生の声優さんの声かもしれないし、AIどうしかもしれない。なかなか難易度が高くなるが、調和する声。レベル4:戦闘だとかほかのキャラクターがいなくなって悲しいとかいろいろな状況がある。それぞれの状況に応じたトーンの使い分けができる。レベル5:最後は感情。感情は要望の最初にくる傾向にもあるが、激高するとか、悲しむとか、いわゆる演技というものを音声合成にさせるというレベル。

 おそらくこういったものがゲーム産業が求めるものだと思っていますと三宅氏。段階に応じてNPCなのか、いっしょに冒険をするキャラクターなのかでレベルに応じて異なってくる。レベル5までくるとプレイヤーとずっといっしょにいても違和感がないというものになり、その間ではたとえば街の人、商人、宿屋のおじさんとかで使えると。役割によってキャラクターの順位が上がっていくという。

固定メッセージからの開放。AIによる音声合成でよりリッチな音声会話が可能に!?

 三宅氏の最後のパートでは、音声合成の制作における現状の課題と、近未来におけるあるべき将来像が語られた。そこには、ひとつのこれまでのRPGなどにおける固定メッセージの呪縛からの開放手段も含まれていた。

 「直接収録する場合はこういうふうに演技してくださいと指示できますが、音声合成の場合は一旦機械学習で音を学習させますので、人間が必ずしもカスタマイズするわけではない。問題はいかに、狙った音が作れるかというのが、ひとつノウハウが必要なところかと思っています。

 さらにできあがったものを調整したいという要望が出てくる。この音は確かに自然なんだけど、語尾を上げたい、このキャラクターは田舎ものだからもう少しイントネーションを変えたいとか。また、一度収録したものを再利用して積み重ねる形にしたい、可能であれば複数の開発にまたがって使いたい、つまり音声合成のシステム自体を資産として積み上げ、かつそれをさまざまなゲームに使っていけるよう、タイトルごとというよりは会社としてシステムを作り上げていきたいという要望もある。

 そういった要望に簡単に応えられることも含め、将来的なビジョンとしては3~4年以降として考えているが、AI側としてはNPCたちがそれぞれ言語生成AI、つまり会話生成機能をもつというのが、達成ポイントとしてある。たとえば、これまでRPGの会話でいつも同じ内容というのがもう30年近く言われてきたと思うのですが、そういった状況を変える、そのときどきの会話がユーザーの状況で行われるように考えられている。ただし、最近のRPGは音声がありますので、そこで音声合成が出てくるわけです。そのレベルに応えられるよう、ゲームの中で自然に先ほどのレベルに応じた会話が行われるよう、段階的に上げていきたい。キャラクターが自律的に考えて話すようにできると、これまでのRPGの根底が自動発生的にリッチになっていく、そういうものを目指すためにも音声合成も必要になってくるわけです。そしてこれが、求める要望なんです」(三宅氏)

楽器的な意味でのシンセサイザー部分の性能はほぼ人間並に

 続いて講演は東芝デジタルソリューションズの倉田氏にバトンタッチ。現在、ゲーム制作やデジタルキャラクターを用いたコンテツでは決まったセリフではない、自由対話が求められており、より自然な声を表現するために具体的に“声の素を作る”、“韻律(いんりつ)転移を活用”、“生音声と合成音の差異の軽減”、“作成した表現の再活用”というステップが必要とのこと。これらのポイントの解説をデモ実演とともに解説され、また技術の詳細と活用した機械学習について説明が行われた。

 倉田氏によると音声合成約20年進化を重ねてきていて、ここ数年非常に良質な音声合成が各社から発表されているとのこと。一方で、その進化の過程においても構造自体はそれほど変わっておらず、シンセサイザーモジュールや言語解析モジュールの作りかたが変わっているケースが多い模様。

 「音素を分割したものを都合よくつなげる波形接続方式から、HMM (Hidden Markov Model、隠れマルコフモデル)による学習方式が開発され、そのジェネレートしていくような作り方がシンセサイザーに導入されたり、そのときに使われる音素編の辞書を機械学習で作ったりということがHMM方式で進みました。さらに2013年以降、ディープランニング方式のDNN(ディープニューラルネットワーク)方式が開発され始め、大量の音声をベースに学習をかけていって、声色を変えるために追加の音声を足していくということやっていく。その学習結果によって、非常に音質が変わってきたということがあります。

 HMM型の最近のものでもDNNのものでも、基本的には人間の声質とほぼ同等に近づいています。声の元の部分というものは、楽器的な意味でのシンセサイザー部分の性能はほぼ人間並になってきてはいるんですけど、そこからのさらなる進化が求められている段階になっています」(倉田氏)

音声合成のプロセス、まずは最重要ポイントの”声の素”

 続いて具体的な制作プロセスとポイントが語られた。まず重要になるのが”声の素”を作るという点にあり、プロセスの中で最重要になるとのこと。

 「第1段階としてよく行われるのは、声のモデル、声の辞書という声の素を作ることから始まります。声の種類とか、声質とか、どういう方向で音声合成を作っていくか。じつはこの工程が、音声合成のゴールみたいなものを決まってしまうといっても過言ではないほど重要になります。どういうデータをどういう方向で収録するか、どういう音をどういう声室さんからどういう声質で採取して作っていくかという点が、最後の音質に影響を与えるのです。




Other Videos By Just Another Player Story


2021-08-29“アニサマ2021”3日目リポート。森口博子さんの『ETERNAL WIND』といった往年の名曲から、本公演で初披露の早見沙織さんの新曲『Awake』まで多彩なラインアップで観客を魅了【随時更新中】
2021-08-29『FIFA 21』司令塔不在で有吉JAPAN大ピンチ! 中澤佑二さん&ラモス瑠偉さんの登場で流れを変えられるか?【有吉ぃぃeeeee! 本日(8/29)22時放送】
2021-08-29『キン肉マン』8月29日(肉の日)よりソルジャーチームをテーマにした販売イベントがオンラインストアで開催
2021-08-29『ウマ娘』3rdライブイベントの冒頭映像公開&4thイベント、2022年に開催決定。ライスシャワーとメジロマックイーンのフィギュア化情報も
2021-08-29“gamescom award2021”結果発表。『エルデンリング』が4冠でBest of gamescom、Best RPGなどを獲得【gamescom 2021】
2021-08-29美少女のイラストが楽しめるブロック崩しゲーム『変身少女 -Second Magic-』がSwitchで発売
2021-08-29外科手術シミュレーション『サージョンシミュレーター2:Access All Areas』9/2よりSteamで発売。ウィッシュリストに登録して購入したユーザー向けの特典も
2021-08-29『ゴースト・オブ・ツシマ』のローカライズで、時代劇らしさとエンタメ性を両立させる苦労。日本語版ローカライズチームの制作秘話【CEDEC2021】
2021-08-29お前のドリルで天を衝け! 色褪せない名曲『空色デイズ』、紅白で見せた中川翔子さんの作品愛溢れるひと言とは?
2021-08-29『塊魂』王子スウェット、王様アクリルキーホルダーなどの新グッズ5点が登場。
2021-08-29RPGの固定会話からの脱出。プレイヤーごとの自動生成音声で自然な会話が可能な未来が!?【CEDEC2021】
2021-08-29Switch・PS5・PS4『アレックスキッドのミラクルワールド DX』が発売! 1986年発売の2Dアクションを最新機種でリメイク
2021-08-29『転スラ』一番くじが本日8月28日発売。リムルやミリム、ギィの3人の魔王がフィギュアに!
2021-08-29【ツイステ】一番コフレPart2が本日(8/28)発売。フェイスカラーは寮生の瞳の色がモチーフ。美しいデザインのリップグロス&コンパクトにも要注目
2021-08-29【にじさんじ】ボードゲーム『あのアレなヤバイにじさんじ』が発売。人気ライバー25名の迷台詞を駆使して“推し”を当てろ!
2021-08-28アニメ『ハイキュー!!』成長するのは主人公だけじゃない! 天才プレイヤーが“孤独の王様”を脱却する名エピソードといえば【アマゾンプライムビデオおすすめ】
2021-08-28『ウマ娘』新衣装の★3マチカネフクキタル、SSRライスシャワー、SSR樫本理子(理事長代理)が登場。アオハル杯の新曲も公開
2021-08-28【ツイステ】一番コフレPart2が本日(8/28)発売。フェイスカラーは寮生の瞳の色がモチーフ。美しいデザインのリップグロス&コンパクトにも要注目
2021-08-28『ウマ娘』新衣装の★3マチカネフクキタル、SSRライスシャワー、SSR樫本理子(理事長代理)が登場。アオハル杯の新曲も公開
2021-08-28“アニサマ2021”1日目リポート。開幕は高橋洋子さんによる『魂のルフラン』、『残酷な天使のテーゼ』【随時更新中】
2021-08-28【ウマ娘】映画『トップガン マーヴェリック』の宣伝パイロットにマヤノトップガンが就任。ねんどろいど“ゴルシ”の制作も決定