ブログ

翻訳業界の様々な面に関する詳しい知識が得られ、全体像を把握することができます。

ハウツー:PDFの翻訳コストを下げるには

この記事では、PDF文書を品質およびコスト効果の高い方法で翻訳するためのベストプラクティスをご紹介します。

PDF文書の翻訳は正しく行えばシンプルな作業ですが、間違った方法で行われた場合、プロセス全体への費用と時間のかかる作業になりかねません。

当社のこれまでの経験の中で、お客様がPDF文書の翻訳において必要以上の費用や問題を抱えるケースをいくつもみてきました。これは正しい翻訳方法をご存知であれば容易に回避できるものなのです。

この記事では、最も一般的な誤りを取り上げ、品質と一貫性を保つための方法を説明する事で、正しい選択を行うためのガイドライドを解説いたします。

PDFとは

Portable Document Format(PDF)は、その開発元であるアドビ社によると、「ソフトウェア、ハードウェア、オペレーティングシステムに左右されず、文書を確実に表示および交換するために、時には基本フォーマットとしても使用される、現代のあらゆるビジネスに適用可能な汎用ファイル形式」です。

PDFは現在、国際標準化機構(ISO)で管理されているオープンスタンダードの一つになっています」と説明されています。

PDFの仕組み

大量のテキスト、画像、さまざまな種類のフォントや図形を含む文書を取り扱う場合、ソースファイルサイズの肥大化の問題に直面します。それによって、ファイルの配布や互換が不可能になってしまいます。

基本的に、PDFはこれらの問題を以下の方法で解消するように作られています。

  • 複数の圧縮方式を使用し、可能な限り品質を損なわずにソースファイルを圧縮します。

  • 文書の書式設定を維持します。

  • 文書は標準化され、配布やパブリッシングソフトウェアでの使用に適するようになります。

  • さまざまなアプリケーションやオペレーティングシステムに対応できるようになります。

これらのプロセスを経てPDFは幅広く利用されるようになりました。「フラット」で互換性が高く、一見ソースファイルと同じように見えながらもかなり小さいサイズのファイルの受け渡しができるのです。

ただし、これは代償を伴う一方通行のプロセスです。PDFの圧縮プロセスにかけられた文書は元に戻すことはできず、編集できないものとなってしまいます。

PDFを翻訳するには、ソースファイル上で作業するのが一番です。現在では、ソースドキュメントをPDF形式で保存できるソフトウェア・アプリケーションが多く存在するため、ソースファイルの元の形式はさまざまなものです。PDFを作成する最も一般的なプログラムには、アドビ製品群、マイクロソフトオフィスアプリケーション、Open Office、Libre Officeなどがあります。

ソースファイルがある場合の主なメリット:

  • 品質 – ソースが利用できる場合、翻訳されたファイルの全体的な品質を可能な限り元のドキュメントと同じものに近づけることができます。

  • 一貫性 – さらに複数の言語ペアで翻訳を行うことを目標とする場合、これは重要となります。例:ある言語で表現されたテキストを別の言語に翻訳すると、元よりも長くなることがよくあります。その場合、すべての要素がレイアウトにぴったり合うように、作成したソフトウェアを使用してファイルを編集しなければならなくなります。通常、複雑なドキュメントを取り扱う際にソースファイルを利用できないと、元ドキュメントのイメージを再現するのはほぼ不可能です。

  • フォント – ドキュメントの重要な要素です。基本的に、フォントとは特定かつ固有のスタイルやサイズを持つ表示可能または印刷可能なテキスト文字で、数多く存在しています。フォントは無料のもの、独自のもの、特定用途向けに作られたもの、ある言語のみで使用できるものなどさまざまですが、一つのことは共通しています。翻訳会社は、そのようなフォントをすべて用意することはできないということです。それに対し、ソースファイルにはそのフォントが含まれているのです。

  • 画像 – ドキュメントにはさまざまなサイズの画像が使われている可能性がありますが、それらの画像はPDF圧縮を行う事により、最大で元の「デジタル」サイズの95%まで小さくすることができます。PDFは主にJPEGおよびFLATEの2種類の圧縮方式を使用して画像を変換します。第1の目的は容量を削減することですが、第2の目的は品質を一定水準に保つことです。このような圧縮には代償が伴います。いったん圧縮してサイズを縮小した画像は、元のサイズに戻すことはできないのです。画像の種類によっては、元のサイズに戻すとピクセル状のギザギザした画像やぼやけた画像になる可能性が高く、そうなった場合、翻訳前の元ファイルと同等の品質を得ることはできません。これが例えば、ソースドキュメントがAdobe InDesign形式(拡張子indd)である場合、ソース画像がそblog 2 chart 2 Edited Japanese Versionのまま維持されるため、品質を損なうことなく画像を新しいドキュメントに配置して、翻訳を行うことができます。

  • 互換性 – 翻訳会社は、コンピュータ支援翻訳(CAT)ツールや翻訳メモリ(TM)などのさまざまなツールや、翻訳のスピード、品質、一貫性を高めつつ顧客側のコストを抑える多様なソフトウェアを使用しています。ソースファイルを利用できない場合、これらのツールがサポートする形式にPDFを変換しなければなりません。

  • コスト – 上記のように、ソースファイルの存在は、翻訳プロジェクトのコスト削減と直結しています。デスクトップパブリッシング(DTP)によってファイルを翻訳に使えるようにするための多くの工程が省略できるのです。

  • 時間 – 時間は最も基本的かつ重要な要素であり、ソースファイルがあれば節約できます。別々の専門家や部署同士でやりとりが行われるプロジェクトでは、追加の編集工程が入るたびに時間がかかります。時差も考慮しなければならない場合、通常は数日で済むプロジェクトに数週間かかってしまうかもしれません。

PDFソースを利用できない場合

さまざまな理由により、ソースファイルが入手できない場合があることは重々承知しています。大企業にお勤めのお客様は、部署間で連絡を取り合ってソースファイルを見つけ出すのは難しいのでしょう。あるいは、ドキュメントはマーケティング代理店に外注しており、そこがソースファイルの提供を渋っているのでしょう(実際、これはかなり一般的な原因です。プロジェクトの納品の時点で、外注先にソースの提供を必ず求めることをお勧めします)。

PDFソースが入手できない理由は、たいていこのような状況です。この場合、いろいろな方法を使用してPDFからデータを抽出し、より編集しやすい形式に変換する必要が生じます。これらの方法の利用や用途、ならびにその結果はPDFそのものの品質に大きく依存しています。対象のPDFはマーケティング資料、単純なテキスト、技術資料、または単純にスキャンしたドキュメントでしょうか。これらのPDFの種類ごとに特別なアプローチと変換方法が必要になります。

PDFの変換方法:

変換ツール – そのツールによって、PDF変換の複雑さ、度合い、使用アルゴリズム、および変換結果には違いがあります。しかし、これらはすべてPDFを編集不可能な形式から編集可能な形式に変換するという一つの目的を果たすものです。多くの場合、望ましい結果を得るには、複数のソフトウェアツールを利用し複数の段階を踏んで変換を行う必要があります。

OCR – 傾いている、画像の中にある、グラフィック効果が適用されている、スキャンしたドキュメントの一部であるなど、ドキュメント内のテキストが標準とは異なる方法で表示される場合、それは文字として選択できません。このような場合は、OCR(光学文字認識)を使用する必要があります。OCRは手書きまたはデジタル化された文章を認識するためのソフトウェア、またはハードウェアツールの一種です。OCRはドキュメントの明るい部分と暗い部分をスキャンして文章や数字のパターンを認識し、それらを自身のデータベースと比較します。この方法では、スキャン対象ファイルの品質によって結果が大きく異なります。

手作業での作り直し – 最終的に、他に手段がない場合は手作業でドキュメントを作り直すことになります。しかし、他の人の筆跡を真似てみた経験はありませんか。そのご経験があれば、どんなにうまくできる方で、たとえよく似て見えたとしても、自分の筆跡は元のものとは幾分異なるものとなってしまうことをご存知かと思います。これはPDFドキュメントの手作業での作り直しと全く同じことです。どちらも技量に大きく依存し、時間と費用を大きく要する上に、結果として出来上がるのは、せいぜい同じように見えるだけのコピーなのです。

まとめ

PDFは広く普及しており、その翻訳に関わる問題はつきものです。そのため、念のためにドキュメントのソースを保管するという簡単な手順を守ることが推奨されます。翻訳を行う必要が生じることは予期できませんが、そうなった場合、ソースがあれば準備はできています。

ここまでに説明いたしましたように、翻訳対象ドキュメントのソースファイルを保管しておくだけで、コスト削減、品質向上、時間節約など、さまざまなメリットが実現できます。また、ソースファイルが手元にないことから生じるすべての問題を容易に回避することもできます。

しかし、ソースファイルを利用できない場合でも、可能な限り元のファイルに近い文書翻訳とすることのできる他の変換オプションが存在しています。

今すぐ翻訳を開始する

AD VERBUM ISO Portfolio
ISO 17100:2015

翻訳サービス品質認証取得企業

ISO 9001:2015

品質マネジメントシステム認証取得企業

ISO 27001:2013

ISMS適合性認証取得企業

  • 言語サービス産業トップクラスの業界団体Globalization and Localization Association(GALA)会員企業

    言語サービス産業トップクラスの業界団体Globalization and Localization Association(GALA)会員企業

  • ヨーロッパにおける言語サービス産業トップクラスの業界団体ELIA会員企業

    ヨーロッパにおける言語サービス産業トップクラスの業界団体ELIA会員企業

ニュースレター購読