
ブログ
Memsourceは初めてですか?

高くつく大きな間違いを避けて、機械翻訳の導入を成功させるためのステップを紹介します。
1:機械翻訳で翻訳するコンテンツのタイプを選択する
すべてのコンテンツがMTに適しているわけではないため、翻訳するコンテンツを選択する必要があります。創造性や文学的要素がないコンテンツほど、機械翻訳に向いています。マーケティングコンテンツや文化固有のテキストをローカライズする場合には、MTは最良の選択とは言えない可能性があります。今後は変わっていくかもしれませんが、今のところ、後悔するよりも安全な方法を選びましょう。
2:個人データポリシーを確認する
MTプロバイダーのプライバシーポリシーを注意深く確認してください。あなたのデータに何が起こり、どのように保存されるかを知っておく必要があります。機密保持の制約がある場合は、選択したテクノロジーが機密保持の条件を満たしているか確認しましょう。
3:データをトレーニングする(可能であれば)
MTをお持ちのデータでトレーニングできる場合は、そうしてください。良い結果を得るには、約10万のセグメントが必要です。データをトレーニングするには、一般公開されているコーパスを利用したり、独自のコーパスを構築したり、コーパスを購入したりといった様々なオプションがあります。トレーニングに使用するデータは、あなたの翻訳のニーズを満たし、さらに高品質である必要があります。
4:ポストエディターのチームを選択する
最高のMT出力結果を得るには、ポストエディットが必要です。MTのポストエディットのトレーニングまたは経験があるチームを選びましょう。そうでなければ、チームメンバーがMTを受け入れられるようにしましょう。ポストエディットは翻訳とは別のものであり、特別なスキルが必要です。MTのポストエディターは、MT翻訳を使用するか削除するかを素早く判断せねばなりません。さらに、細部にも気を配らねばなりません。というのも、MT翻訳は文法的に完璧でありながら、原文を正しく訳していない場合もあるからです。翻訳者に、彼らが受け入れられないことや、教えていないことを行うよう強制してはいけません。そんなことをすれば、彼らとの関係が台無しになったり、翻訳の質を落としたりすることになりかねません。
5:MTを実装する前にサンプルを実行しましょう
サンプルが大きいほど良いです。最初の試みは期待外れの結果をもたらすかもしれません。その場合には、ポストエディターに送信する価値はありません。人間の翻訳をMTの出力と比較することで、編集距離レポート(edit-distance report) を生成できます。もし良い結果になれば、そのMTを選びましょう。そうでない場合は、時間をとって、どこを改善できるか検証してみることをお勧めします。言語ペアによって結果が異なる場合もあるのでご注意ください。言語ペアの中には、MTのパフォーマンスが他より優れているものがあります。たとえば日本語とフィンランド語のMT翻訳の結果が、イタリア語とスペイン語と同じレベルの品質に達するまでには長い道のりがあります。
6:価格設定に同意する
必ず事前に価格を設定し、すべての利害関係者を決定に関与させてください。このようにすれば、不愉快な支払い紛争を回避できます。コンテンツの種類、言語ペア、使用しているテクノロジー、サンプルテストの結果などを考慮してください。支出額を事前に知りたい場合は、過去のパフォーマンス(完全に信頼できるわけではありませんが)をチェックするか、何らかの機械翻訳の品質見積もり(MTQE)を作成してくれるテクノロジーを利用しましょう。見積もり結果は、後日、実際にポストエディットに要した作業と照らし合わせる必要もあります。見積もりが正しかったか検証しておきましょう。
7:MTを導入する
導入後、結果がすぐに期待に応えられない可能性があることに注意してください。良い結果になるプロジェクトもあれば、ひどい結果になるプロジェクトもありますが、落胆しないでください。トレーニングとチューニングを続ければ、時間がたつにつれて、機械翻訳の品質はどんどん良くなっていきます。時がたてば、きっと機械翻訳のメリットが分かります。そのときにはMT導入前は一体どのように翻訳業務を行っていたのか、不思議に思うほどになるでしょう。