大西佐七のザ・飛騨弁フォーラム

オフラインのAI音声認識アプリケーション

戻る

私:表題だが、どう思う？サイトはAmiVoice(R)ScribeAssist
君:なるほど、会議議事録を作成する為に自動翻訳するオフラインのアプリケーションを開発した会社ね。音声認識ソフトウェア市場一番となっているわよ。
私:インターネット接続不要で情報漏えいリスクを最小化ってのがいいね。
君:クラウドサービス市場とも書いてあるわよ。siri と同じで膨大なデータの deep learning が必要な音声認識は、やはりクラウドサービスじゃないかしらね。
私:Zoom とか、ウエブミーティングとか、皆がやっているけれど、若しかして情報が筒抜けのような感じがするね。公開討論、つまりは学会などには向きだろうが、密談向きでは無いだろう。
君:そんな事は当たり前だわよ。それはいいから、方言のお話にして。
私:はいはい。上記の会社のコンテンツには続きがある。方言で話すと、音声認識の精度は変わるのか？
君:結論は？
私:"結論から書くと、共通語に比べて方言の認識精度は低くなる傾向があります。共通語と単語自体が異なる方言などの場合、どうしても認識されにくいです。"との事。当然の結果か。
君:より具体的には？
私:音声認識は、アクセントやイントネーションの違いに比較的強い傾向がある。但し、例えば「～やけど」を「火傷」と認識してしまう、などの欠点があるが、これは単語登録してから使った場合に格段に精度が上がり、実用性は十分なレベル。それ以前の問題として、自動音声認識は録音そのものの技術に左右されるので、質の良い録音をする事が重要。
君:発表者は臆する事なく方言をお使いになってもよいけれど、大前提条件としては明瞭な話し方が要求されるようね。ほほほ

ページ先頭に戻る