2009/11/16
音声認識は方言に弱い?:音声対話システム開発メルマガ 第36号
☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆ 楽しい!話し合えちゃう音声対話システム開発 音声対話システム開発の基本、ハウツー、 便利なツールやソフトを隔週でご紹介します。 ☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆ [ 第36号 ] こんにちは、音声対話システムのアジリングアです。 アメリカでは今月末はサンクスギビングです。 家族が集まってターキーやかぼちゃパイをいただく祭日なのですが 去年、おととしと私はちょうどこの時期に 日本で展示会に出展していてターキーを食べ損なっていました。 そして今年もそのころ日本に参ります。 今号では音声認識システムと方言について 実際のニュース記事を例に解説しますが、 最後に11月末に日本にてお披露目する 新製品の発売についてのお知らせもあります。 それでは最後までよろしくお付き合いください。 ■ 「最高裁が採用の認識システム、津軽弁に対応できず」 これは今年の5月の記事なのですが、 山陽新聞ウェブユースより抜粋した一部をまずご覧ください。 “21日の裁判員制度開始を前に、法廷での被告人質問や 証人尋問のやりとりを自動的に文字化して記録する 「音声認識システム」が、「うっと(とても)」など 一部の津軽弁を識別しない可能性の高いことが19日、分かった。“ http://svr.sanyo.oni.co.jp/news_k/news/d/2009051901000065/ この記事を書くにあたり、「最高裁」「音声認識」を 検索ワードにして新聞記事や個人ブログなどを調べてみたところ、 日本各地の裁判所ではさまざまの方言が使われているのだから、 標準語しか認識できない音声認識システムは 裁判のような重要な場では不適切なのでは、という 論調のものがほとんどでした。 3億とも4億円ともいわれる税金を使っての開発なのも ネガティブな意見を誘っているのかもしれませんが、 では音声認識システムは方言など人が日常で自然に話している 言葉を認識する場面では本当に役に立つのでしょうか。 ■ 音声認識システムは方言に対応できない? たとえば沖縄弁では「盗まれました」ということを 「盗まってぃねーやびらん」と言うそうです。 「ねー」とか入ってると盗まれてないような感じが・・。 これは沖縄方言を知らない人にはわかりませんね。 また、広島方言では「借りた」を「かった」と発音するそうです。 これは標準語使用を前提とした認識システムなら、 文脈にもよりますが「買った」と認識してしまうでしょう。 これらの例でわかってもらえるといいのですが、 音声認識システムは使用する場面、場所、話者などを想定した開発と、 その都度使用される単語や言語発音のチューニングが必要なのです。 つまり、各地での使用を想定して認識システムを それぞれ開発、チューニングすれば方言にも かなり対応できるようになるのです。 ご参考:第18号“インド人英語対応音声認識ソフト?” http://www.agilingua.com/jp/magazine/18.php 事実、大阪弁には対応するプログラムは開発されているようです。 “裁判員制度、「関西弁もOK」音声認識システム完成” http://sankei.jp.msn.com/affairs/trial/090114/trl0901142233020-n1.htm サンケイニュース2009年1月14日 この件についての課題は音声認識システム自体の テクノロジーだけでなく、コストや手間を考えつつ 各地の方言や法廷で使用される単語や言い回しなどを どのくらいどのようにカバーするか、ということもありそうですね。 ■{告知}新製品をリリースします! 唐突ですが11月25日に新製品を発売します。 25日から東京国際展示場で開催の2009国際ロボット展で 製品をお披露目しますが詳しくはまだお知らせできません。 すみません! 2年前の2007年には出展させていただいた国際ロボット展ですが 今回はパートナー企業様のブースにて 新製品を展示させていただくことになりました。 アジリングアのスタッフもそちらの企業様のブースにお邪魔します。 そして今回は会場の一部をお借りして 新製品発売に関する記者発表会も行います。 新製品リリース記者発表会は国際ロボット展会場内、 大阪ロボットラボラトリーRooboブースSR3-3にて 11月25日(水)12:05-12:30です。 報道関係者様はどうぞお立ち寄りください。 2009国際ロボット展概要とアクセスはこちらです。 場所: 〒135-0063 東京都江東区有明3-21-1 東京ビッグサイト 最寄り駅:りんかい線 国際展示場、ゆりかもめ線 国際展示場正門 日時:2009年11月25日(水)― 28日(土) 午前10時ー午後5時 (最終日は午後4時30分まで) ご来場をご予定の方はどうぞお立ち寄りください。 詳しくは25日に号外でお知らせします。 ■編集後記: 新製品のリリース準備その他で猛烈に忙しいのですが NYで公演している香取信吾主演のtalk like singing 観てきちゃいました。面白かったです! たまに劇場で観劇するのっていいですね。 目の前でパフォーマンスをする役者さんから パワーをもらえたような気がします。 ストレスリリース&リフレッシュできたので また頑張ります。 それでは最後までお付き合いいただきありがとうございました。 ________________________ [楽しい!話し合えちゃう音声対話システム開発] 発行者:Agilingua, LLC. 発行者サイト:http://www.agilingua.com/jp/main/index.php 配信中止はこちら:http://www.mag2.com/m/0000251894.htm ご感想、お問い合わせはお気軽に:magazine@agilingua.com ________________________


