Khafraは、筑波大学 自然言語処理 on the Web 研究室が開発した、オープンソースのフレーズベース統計的機械翻訳(PBSMT)デコーダです。
Khafraデコーダは、オープンソースのPBSMTシステムMosesにより学習したモデルを利用して翻訳を行います。探索にDPビームサーチ(詳しくはこちらを参照)を採用することにより、Mosesに比べて10倍速い翻訳が可能になりました。
本ソフトウェアには、以下のような特徴があります。
Khafraの特徴
- Mosesと互換
- Mosesで学習したモデルを利用
- フレーズ翻訳モデル
- リオーダリングモデル(Lexicalized Block Orientationモデル)
- 現在は、LBOモデルとしてmsd-bidirectional-feのみに対応
- N-gram言語モデル
- Mosesで使用できる基本的なオプションを実装
- Mosesで学習したモデルを利用
- DPビームサーチ[Zens and Ney 08]の採用により、Mosesとほぼ同じ精度で10倍速い翻訳を実現
- 本ソフトウェアでは、[Zens and Ney 08]で提案されている枝刈り法のうち、
lex.hyp. pruning per cardinality(従来の枝刈り法)のみをサポート
- 本ソフトウェアでは、[Zens and Ney 08]で提案されている枝刈り法のうち、
- ライセンス:MITライセンス