暇だった。
いや、なぜか今日は休日だったので、いっぱい読書だった。
そんな休日だったわけですが。
読書しまくって、一気に読破してしまうのも勿体無いので。
プログラミングしてました。
覚えているでしょうか。
ローマ字からひらがなへ変換 するヤツ。
とりあえず、アルファベット中の入力子音になる物には全対応。 ただし、2文字版で。
ひらがな変換とか言いつつ、Vにも対応したため、ヴが登場するゲテモノです。
さらに、だった、のような小さい”つ”にも対応。
(余談、datttta と入力すると、だっったになり、dattta だと、だった)
難しいと思っていたこの小さいつ。
だが、意外な所に同じアルゴリズムで対応していた所があったのだった。
盲点。 いや、その部分を解決していた私の才能に乾杯。
そこで課題だった、ごっそり文章を変換しよう、でしたが。
諦めます。 なぜなら、
ローマ字って、文章の時と単語の時で、別のひらがなになる、物があるからです。
どうやって判別するか。
あらかじめ前後の関係を調べながら全文を検索し、その場所を記憶。
変換がそこに来たら、強制的に変換。
そんな面倒な事になりそうなので、やめます。
このプログラムは、普通の入力と違って、全体一括入力なので。
色々判断の難しい部分が出てきます。
まぁ逆に、全文検索なんて事が可能になりますが、しないので意味ないです。
そんな事より、私なりの変換オプションを付けたいなと思う。
なぜか大学時代、言語学をまじめに勉強していた(数学修士なのに)ものですから。
昔の発音の導入とか。 まさか昔のひらがながこんなに英語チックだとはねぇ…。
もしくは、一部、漢字にも対応してみようかな、とか。
あ、カタカナオプションもあり?
しかし、そうなると変換データベースが膨大になりすぎるなぁ…。
この際、外部化しようかな。
外部テキスト読み込んでる時点で、大して変わんないしね。
あ、そんな事考えてたら、アルゴリズムの改良を思いついた。
このほうが効率良いな。 サイズも小さくできるし。 処理速度も上がるぞ。
メモリは喰うが。 つっても、こんなプログラムごときのメモリ消費なんて微々ですが。
あ、そうか。
”っ”アルゴリズムを利用すれば、文章難題も解決できる。
頭良いな、私。
マジで結構なプログラムになりそうだ。
期待して待てっ!