Jun 29, 2011

anthy9100h+G-HAL's patch+UTUMI's Anthy dictionary [computer]

anthy_test_110628.tar.bz2

Q:これは何?

A: FreeBSDのports形式のアーカイブです。 日本語かな漢字変換システムのjapanese/anthyに修正を加えて変換効率を上げられるよう既存のpatchを加え、改良された辞書を使うようにしたものです。 元々のjapanese/anthyからの変更点は以下の適用です。

G-HALさんのパッチ(patch13)は、anthyが使っているうちに少し前の学習結果を忘れてしまう問題に対処するところから始まった変換効率改善パッチです。patch13は学習データの量の上限の拡大、学習情報のシステム辞書の頻度情報の扱いの変更、iconv対応(辞書データのutf-8対応)等の変更が行われているようですが詳しくはG-HALさんのページを参照してください。patch0はanthyに元々含まれているコーパス情報を無効にするパッチです。元々のコーパス情報が実状に合わないのではないかという検討に基づいたものです。

UTUMI Hirosiさんの辞書はvagusさんのcannadic改(alt-cannadic)をもとにG-HALさんのシステム辞書頻度情報の扱い変更に会わせて頻度情報のチューニングを行ったものです。utf-8辞書のため利用にはG-HALさんのパッチ適用が必要です。 UTUMI HirosiさんはModified Anthyというパッチ込みのソースを作成されていますが、従来のportsとの連続性を考えてG-HALさんのパッチ+UTUMIさんの辞書という形式をとっています。

Q:今使っているanthyからアップデートして問題ない?

A: G-HALさんのページによれば 個人用の単語辞書、個人用の学習データ、 インストール後のシステムの辞書、 全てに於いて、一部の文字の互換性が無くなります。 ということです。問題の出る文字は G-HALさんのWebを参照してください。 思い切りよく~/.anthy/以下を一旦消してしまうというのも手です。

Q:send-prはする?

A: まぁ、気が向いたら(w 上記の互換性の問題があるので様子見というのもありますが、自分で使うために作ったのでかなりやっつけです。

Q:何か余計なものに依存していたりする?

A: UTUMI HirosiさんのAnthy dictionaryの作成にrubyが必要です。特に意味はありませんがDEPENDの指定をしていませんので無いとエラーになります(w

Posted at 01:06 in computer

Archives
Powered by
blosxom 2.0
and
modified by
blosxom starter kit