大西佐七のザ・飛騨弁フォーラム |
オフラインのAI音声認識アプリケーション |
戻る |
私:表題だが、どう思う?サイトはAmiVoice(R)ScribeAssist 君:なるほど、会議議事録を作成する為に自動翻訳するオフラインのアプリケーションを開発した会社ね。音声認識ソフトウェア市場一番となっているわよ。 私:インターネット接続不要で情報漏えいリスクを最小化ってのがいいね。 君:クラウドサービス市場とも書いてあるわよ。siri と同じで膨大なデータの deep learning が必要な音声認識は、やはりクラウドサービスじゃないかしらね。 私:Zoom とか、ウエブミーティングとか、皆がやっているけれど、若しかして情報が筒抜けのような感じがするね。公開討論、つまりは学会などには向きだろうが、密談向きでは無いだろう。 君:そんな事は当たり前だわよ。それはいいから、方言のお話にして。 私:はいはい。上記の会社のコンテンツには続きがある。方言で話すと、音声認識の精度は変わるのか? 君:結論は? 私:"結論から書くと、共通語に比べて方言の認識精度は低くなる傾向があります。 共通語と単語自体が異なる方言などの場合、どうしても認識されにくいです。"との事。当然の結果か。 君:より具体的には? 私:音声認識は、アクセントやイントネーションの違いに比較的強い傾向がある。但し、例えば「〜やけど」を「火傷」と認識してしまう、などの欠点があるが、これは単語登録してから使った場合に格段に精度が上がり、実用性は十分なレベル。それ以前の問題として、自動音声認識は録音そのものの技術に左右されるので、質の良い録音をする事が重要。 君:発表者は臆する事なく方言をお使いになってもよいけれど、大前提条件としては明瞭な話し方が要求されるようね。ほほほ |
ページ先頭に戻る |