PDA自作日記 | ||||||
ホーム | 開発日記 | 自作PDAまとめ | NetWalker | プロフィール | ||||||
最近の日記
最近のコメント
|
━ 基板データ公開 ━━━━現バージョンの基板データをダウンロードできるようにしました。 以下のページからダウンロードしてください。ただし、これだけあっても何もできませんので、設計の参考程度にお考えください。 (2010/05/20) コメントを書く・コメントを読む ━ かな漢字変換ログ ━━━━かな漢字変換の改良のため、ログを取るようにしました。 自作PDAでは、独自開発したかな漢字変換を使用しています。変換方式はn文節最長一致ですが、いくつかのパラメータは試行錯誤により決めています。 ただ、これらのパラメータを適当に変えて良さそうなものを選ぶ、という方法には問題があります。例えば、今は「へんかん」→「変かん」→「変化ん」→「変換」という候補順になっています。つまり、語幹が短いものが先に出てきます。これを語幹が長いものから出そうとすると、今度は「勝田」→「買った」の順になってしまいます。どちらに決めても、どちらかがマイナスになります。そこで、テストデータを作り、うまく変換できるかどうかでスコアをつけ、パラメータを設計する必要があります。 その第一段階として、かな漢字変換に手をいれ、メモリカードにログを出力するようにしました。ログの内容は、変換結果の確定時に、文節ごとの読みと表記を出力する、というものです。テストのときは、この読みを入力して変換をおこない、正しい表記にするのにどれくらいの変換操作が必要かをスコアとすることを考えています。文節ごとに分けるのは、文節区切りを自動的に修正するためです。 単にログだと、間違えて確定してしまったものをあとで取り除く必要があります。そのため次のステップとして、入力したテキストデータ中に、かな漢字変換の情報を埋め込むのを予定しています。これは、最終目標である「コンテンツベース学習」、つまりいま編集しているドキュメントにすでに出てくる表記が、優先的に表示される機能につないでいく計画です。 (2010/05/03) コメントを書く・コメントを読む ━ その他のバックナンバー ━━━━
|
|||||
Copyright © π 2009-2012 Powered by light work group このページの内容は無保証です |