Akaza
Akaza は、Rust で書かれた統計的かな漢字変換エンジンを搭載した Linux 向け日本語 IME(IBus エンジン)です。
特徴
- 誰でもモデルを再構築可能: 言語モデルは日本語 Wikipedia、青空文庫、CC-100 というオープンなコーパスのみから構築しています。学習パイプラインもすべて公開されているため、特定の企業やプロプライエタリなデータに依存せず、誰でも自分の環境で 1 からモデルデータを再生成できます
- Rust で実装: UI/Logic をすべて Rust で書いてあるので、拡張が容易です
- 統計的かな漢字変換: 単語 bigram モデルを採用し、ビタビアルゴリズムによる最適経路探索で変換を行います
- 学習機能: ユーザーの変換結果を学習し、使い込むほど変換精度が向上します
- SKK 辞書対応: SKK 形式の辞書ファイルを複数読み込み可能
- GUI 設定ツール: GTK4 ベースの設定ツール (
akaza-conf,akaza-dict) を提供