大西佐七のザ・飛騨弁フォーラム |
方言コンバータブーム |
戻る |
私:昨晩は2000年初頭の空前の日本語方言サイトブームについてお話しした。 君:ウインドウズの出現により、PCはスタンドアロンの機械ではなく、インターネットにより世界の情報を集める機械に、或いは個人が気軽にウエブサイト開設が出来るようになり、メール文化が花開いて、個人が世界に情報発信する時代になったからなのね。 私:うん。当時の日本語方言サイトはざっと数百だったね。僕は今は地域共通語とか、方言量の調査は専ら方言辞典にあたる事にしているが、当時の僕はネット検索で全国の語彙分布を調べていた。 君:なるほど、当時から検索サイトは存在したのよね。 私:goo検索が日本語に強かったのを覚えている。グーグルの発足が1998、当時は弱小。ははは、信じられないだろ。 君:ところで方言コンバータとは。 私:日本語共通語のテキストを枠に入力した後に変換ボタンを押すとご当地の方言に変換してくれるというソフト。 君:変換、ってプログラミング技術がいるじゃないの。 私:ははは、実は仕掛け人がいたんだ。彼の名は Takanori,Sugita。彼自身が「なんでやねん v1.3」なるものを書き上げ、ネットに公開していた。ページのソースには /****************************************************** なんでやねん v1.3 (c) Takanori,Sugita MAIL:tomtak@leo.bekkoame.or.jp URL :http://www2f.meshnet.or.jp/~takan/javac/ このクレジットを消さなければ使用は自由です。 *******************************************************/ が埋め込まれていたので私も遠慮なく使わせていただいた。458語の飛騨方言の語彙を埋め込み完成したのが「飛騨方言コンバータ「うたていこっちゃえな!」β版」。ホームページ作成スキルがあればだれでも数時間で完成できる。 君:暇がないと駄目ね。 私:その通り。要は「共通語語彙・飛騨方言語彙」この対の数を黙々と増やしていけばいいのだが、やり方はたったひとつ。 君:ア行から片っ端という事では労多くして功少ないのよね。 私:その通り。登録すべき語彙は重なり語数の多い飛騨方言の単語、あるいはフレーズ、この一言に尽きる。 君:重なり語数とは長い文章で繰り返し使われる言葉の事よね。 私:その通り。何と言っても一番に多いのが方言文末詞だね。この部分に端的に文章としての方言らしさが現れる。 君:文末詞も代表的なのをまずは登録すべきね。 私:その通り。ところが文末詞の登録は非常に厄介な点がひとつある。 君:ほほほ、活用するという事でしょ。未然・連用・・と六通りの登録が必要ね。 私:それは当然だが、もっと深刻な問題がある。 君:ははあ、終止形と連体形は同じ音韻だから、これをどうやって区別させるか、という事ね。 私:終止形には終止符込みで登録するとよい。すると必ず終止形になり、正しく変換される。それともうひとつ、文末詞の変換には厄介な問題が存在する。 君:ほほほ、わかるわよ。テンスの問題でしょ。現在・過去・未来で別々に登録しないといけないわ。 私:うん、文末詞には更にもうひとつ、問題がある。 君:ほほほ、ジェンダーね。男言葉と女言葉を登録しないといけないのね。 私:その通り。活用の区別、終止連体の区別、テンス、ジェンダー、ひとつの文末詞を登録するのも大変なんだよ。 君:でも、ひとつの文末詞の登録が完了すると、二番目の重なり語数の文末詞は比較的、簡単じゃないのかしら。 私:おっ、鋭いな。要は活用部分というものは似通っているから、多少の修正で二番目の文末詞は完成する。複合助動詞に至っては後方部分の挙動が問題であって、前方部分は活用しない。また文末詞の文末詞たる所以は実は複合助動詞。要は登録も一定パターンというものに気づけば、後はドミノ式に登録が可能だ。 君:コツがつかめてくると、あっという間に数百の飛騨方言語彙の登録が完了するというわけね。然も登録の大半は文末詞なのよね。 私:そういう事。続いては共通語としての日常語彙で重なり語数の多いものは何かを考え、それが方言の言い回しがあれば登録する。俚言については方言らしさの最たるものだから必ず登録する。というプロセスを経て、方言コンバータは完成に近づく。 君:要は方言が好きでなきゃ、という事ね。 私:そう言う事。でも数百ほどの登録が終わって、日本語のどんな文章も、ほぼ満足できる方言変換が出来るようになった時の快感は何物にも代えがたい。それとプログラマーの美学というものがひとつあって、これこそが一番に重要な事だけれど、わかるかな。 君:如何に完璧に方言変換できるか、という事でしょ。 私:そう。正解だ。だが完全正解ではない。 君:うーん、意味深ね。・・わかったわ、例え何年かけて何万語を登録しても方言コンバータが完璧に変換できる事はない。否、むしろ、如何に少ない登録でもいかにも方言らしい変換が出来れば合格、という事で、如何にして登録数を減らしてそれらしいコンバータを作成できるか、という事よね。 私:そう。それこそ完全正解。従って僕は458語で一応の区切りとした。方言コンバータに完成という言葉は無い。最後は人間だ。 君:たったひとつの方言語彙に万感の思いというものが込められているわけだから、それは当然よね。 私:そうなんやさ。いままでずうっとサイトに文章を書き続けてきたんやが、行間を読んでもらいたいんやさ。 君:ほほほ、言わず語らず、心配せんことやさ。言わぬが花、語らずが花。 |
ページ先頭に戻る |