大西佐七のザ・飛騨弁フォーラム

NTTのAI音声認識

戻る

私:表題だが、どう思う?サイトはNTT東日本NTTのAI、仙台や広島の方言も聞きとれます
君:なるほど、各地の方言をNTTのAIが共通語に自動翻訳するクラウドサービスを開始したというお話ね。実用化出来たのね。"札幌、仙台、名古屋、大阪、広島、博多、熊本の7地域の方言をAIに覚えこませた。難解な表現も理解して文章にできるようにした。"との記事だわ。
私:リンク画像だが、場所、方言、従来のAI変換、共通語訳
札幌、したっけ西区へ行くべ、下請け西区へ行くべ、そうしたら西区へ行くとしよう
仙台、仙台店までの行き方教えてかねが、仙台店まで生き方教えて怪我、仙台店までの行き方教えてください
名古屋、いやマジうまいもんで食べてみやて、やまじでうまいもんでたべてみ宛、いや本当にうまいから食べてみなさいよ
広島、見たこともなあ量だったけどね、見たことマナー量だったけどね、見た事も無い量だったけどね
熊本 もっとはよ支度ばせんとせっかくの予定がめちゃくちゃになるばい、もっとはよう支度箸円としたくの予定がめちゃくちゃなのは、もっと早く支度をしないと折角の予定が滅茶苦茶になります


君:NTTのAI音声認識は従来のAIでは誤った音韻解釈、即ち、したっけ・下請け、かねが・怪我、みやて・み宛、もなあ・マナー、ばせんと・箸円と、を正しく解釈できるようになったという事なのよね。
私:その通り。自動翻訳のプロセスというのは以下の通りだ。
  1. 周波数の分析、つまり音素(子音母・音、等)の特定
  2. 音素の特定から音韻(あいうえお、かきくけこ、等)の特定
  3. 音韻の特定から適当な単語への変換
  4. つまりは音の全てを単語の連続と認識出来たら、日本語文法ならびに各地の方言文法に基づいて日本語へ変換

君:NTTの新型AIは四つの全ての項目について改良が加えられたのかしらね。
私:うーん、多分そんなところでしょう。だが然しだな、名古屋弁は八母音だ。つまり日本最強の方言。AIには無理でしょう。
君:北海道方言の「したっけ」とは?
私:「そうしたら」の音韻変化で若者言葉、つまりは近年の言葉らしい。「したっけ」が「したうけ」と認識されてしまう時点で従来のAIはアウトだった。他の例も同じ。
君:「シタッケ」と正しい音韻解釈が出来たとしても、これが札幌では「そうしたら」という意味になる事を理解するにはAIが北海道方言の文法に精通していないといけないのよね。
私:その通り。AIは「したっけ」が文節である事を認識する必要があり、北海道方言に於いては会話の流れから副詞句「そうしたら」を当てはめると会話が成立する事を認識する必要がある。
君:会話にはパターンというものがあるし、日常会話は表層的な意味のものでしかないから、deep learning でなんとか行けそうね。
私:いや、それは甘いな。単語と文法さえ記憶しておけば日本語が理解できる、というものではない。言語学には意味論という分野がある。単語(音韻論)、文法、意味論(構造的意味論、認知意味論)、この三者のどれが欠けても言語の理解は成立しない。NTTの新型のAIは意味論を学習し始めたという段階なんだろう。
君:ほほほ、何を言っているの。学会発表を思い出して御覧なさいよ。
私:まあね。発表後の質疑応答の時間というものが学会の学会たる所以だが、こう聞かれたらああ答える・ああ聞かれたらこう答える、という事でパターンというものがある。鋭い突っ込みに対しては、なるほどそのようなお考えもありますね・ご指摘の点を参考に更に研究を重ね次回によりよい発表ができたら、と考えます、とか。要はゼロ回答をすればいいんだよ。それはつまり、国会の政治家の答弁が正にそれだ。それにAI君にはお互いがそれぞれの思い出を引きずって生きている男女の心の機微なんてのは理解できんだろうなあ。
君:当り前よ。ほほほ

ページ先頭に戻る