発言者の音声を声紋で照合する電話会議システムの通信端末の特許発明 ソフトバンクモバイル

JPB_0005728456_fig2

 電話会議システムに接続するための通信端末に関する発明です。従来の電話会議システムでは、音声の発言者が誰であるかわかりにくいという問題がありました。

 この発明では、発言者の音声の声紋を予め記憶した声紋と照合して発言者を認識します。これにより、電話会議の参加者は、会議で発せられた音声の発言者が誰であるかを認識することができます。

 特許第5728456号(特開2014-86796) ソフトバンクモバイル株式会社
 出願日:2012年10月22日 登録日:2015年4月10日



 ※特許の本の紹介。
 特許の申請(出願)をする技術者や研究者が知っておかないといけない特許の知識がわかりやすくまとめられている良著です。

音声の発言者が誰であるかわかりにくい問題

 電話会議システム(電話を用いた音声による遠隔会議システム)では、複数の拠点のマイクとスピーカが電話回線によって結ばれ、複数の拠点を接続して複数人で音声通話をすることができます。各拠点では、通信端末の先に複数の参加者がいる場合もあります。

 そのため、通信端末から聞こえてくる音声からの判断だけでは、音声の発言者が誰であるかわかりにくい場合があります。発言者が誰だかわからないと、電話会議の進行が妨げられるなどの問題があります。

発言者の音声の声紋を予め記憶した声紋と照合して発言者を認識

 この発明の電話会議システムでは、発言者の音声の声紋を予め記憶しておきます。

 そして、記憶している音声の声紋と、電話会議システムを用いた会議中に発せられた音声の声紋とを声紋分析により照合します。この照合により、その音声の発言者が誰であるかを判定し、発言者の情報を通信端末に送信します。

 この発言者の情報によって、電話会議の参加者は、会議で発せられた音声の発言者が誰であるかを認識することができます。

【課題】
低コスト化を図りつつ電話会議システムで発言している発言者の識別や認証が可能になる通信端末を提供することである。
【請求項1】
 2以上の通信端末により同時に通話可能な電話会議システムに接続可能な通信端末であって、
 通信網を介して電話会議システムに接続して他の通信端末の利用者と通話するための通話手段と、
 既知の人物の声紋を記憶する記憶手段と、
 前記電話会議システムで発言している発言者の音声の声紋を取得する声紋取得手段と、
 前記声紋取得手段で取得された声紋と前記記憶手段に記憶されている声紋とを照合する声紋照合手段と、
 前記声紋照合手段による声紋照合の結果を出力する出力手段と、
 前記電話会議システムに参加する利用者の招集先の通信端末に発呼し、該招集先の通信端末に、声紋照合に用いる所定の音声を促す音声案内を送信する手段と、
 前記招集先の通信端末から受信した招集先の利用者の声紋と前記既知の人物の声紋とを比較し、両者の声紋が一致した場合、該電話会議システムの参加者の声紋情報及び端末情報を該招集先の通信端末に送信する手段と、を備えたことを特徴とする通信端末。

今日のみどころ

 電話会議システムは、複数人が使えるマイクとスピーカとを有する端末を複数拠点に配置することで、遠隔地を結ぶ会議が簡易的に実現できるので、ビジネスにもよく利用されていると思います。しかし、電話会議システムでは遠隔地にいる人の発言の様子が見えないので、誰が発言しているのかわからないということがよくあると思います。

 この発明では、音声の声紋を用いて声紋分析により発言者を判定します。発明を構成する個々の技術要素は既知のものと思いますが、電話会議システムと、声紋による発言者の識別技術との組み合わせでうまく効果を説明でき特許性が認められたものと思います。

コメント

  1. […] 他の記事で、発言者の音声を声紋で照合する電話会議システムの通信端末の発明 ソフト…という記事では、電話会議システムの課題として発話者が誰かが分かりづらいという課題の解決になっています。声紋というのを認識出来ること自体面白いですが、確かに複数人いると電話は分かりづらい(とくに声が似ているときついですよね)ので、なるほどなあと思いました。 […]