概要
PDFからFLIPPERを使用してブックコンテンツを作成する場合、PDFの内部構造によっては、テキスト抽出ができない場合があります。
テキストが抽出できないPDFの共通点として、「フォームXObject」配下にあるテキストが抽出できないことが確認されています。
FLIPPER U2をバージョン5.0.11にアップデートし、再度変換を行うことで解決する可能性があります。
お手数をおかけしますが、製品のアップデートをお願いいたします。
解決できなかった場合は、本記事の方法でご対応ください。
フォームXObjectの確認方法
- 該当のPDFをAcrobat Proで開きます
- コンテンツパネルをクリックします。
- フォームXObject配下にテキスト情報があるか確認します。
回避策
本記事でご案内している回避方法でPDFを再変換すると、XObjectが消えてテキスト抽出ができる事を確認しています。
本記事でご案内する方法で作成したPDFでFLIPPERでブックを作成した場合の注意事項
- PDFに設定されているしおりとリンクが無効になります。
必要に応じて、しおりやリンクは、FLIPPERの編集画面で設定を行ってください。 - PostScriptは、透明を表現する機能を持っていないため、透明効果が設定されている原稿の場合、オブジェクトが分割され分割線が表示される場合がございます。
1)印刷ダイアログボックスで「Adobe PDF」を選択して印刷する方法
「Adobe PDF」を選択して印刷する処理は、内部的にPostScript に変換され、それが自動的にDistillerに渡されてPDFに変換されています。
この方法はWindowsでの対応方法となります。Macを利用している場合は、「2)Acrobat DistillerでPDFを変換する方法」でご対応ください。
使用するツール
- Acrobat Pro
手順
-
FLIPPER用プリセットをダウンロードします。
※ 解凍後の「LOGOSWARE FLIPPER.joboptions」を手順2で利用します。
https://download.logosware.com/soft/flipper-u/dl/preset.zip
- InDesign CC、Illustrator CC、Photoshop CC、Acrobat Distiller などのいずれかでFLIPPER用プリセット(Adobe PDFプリセット)を読み込みます。
補足)プリセットについて
※ FLIPPER用プリセットを利用しない場合、ブック形式にした時、色味が変化する場合があります
※ 以下いずれかで読み込むとAdobe Creative Cloud アプリケーション間で共有されます。
・ InDesign、Illustratorの場合は、 [編集]>[Adobe PDFプリセット] から読み込み可能。
・ Distillerの場合は、[設定]>[Adobe PDF設定の追加] から読み込み可能
- 該当のPDFをAdobe Acrobatで開きます。
- [ファイル]>[印刷]を選択します。
- プリンターのメニューから[Adobe PDF]を選択します。
- [プロパティ]>[Adobe PDF設定]タブ>PDF設定から「LOGOSWARE FLIPPER」を選択します。
補足)
※ 手順2でFLIPPER用プリセットを読み込まなかった場合は、PDF設定から「標準」を選択します。
この場合、ブック形式にした時、色味が変化する場合があります。
- ページサイズ処理を必要に応じて設定します。
- [印刷]ボタンをクリックします。
- 出来上がったPDFを利用してFLIPPERで作成を行ってください。
2)Acrobat DistillerでPDFを変換する方法
使用するツール
- Acrobat Pro
- Acrobat Distiller
手順
-
FLIPPER用プリセット(Adobe PDFプリセット)をダウンロードします。
※ 解凍後の「LOGOSWARE FLIPPER.joboptions」を手順4で利用します。
https://download.logosware.com/soft/flipper-u/dl/preset.zip
-
Acrobat Proで該当のPDFファイルを開きます。
※手順5の作業でここで開いたPDFが上書きされる為、念のため元データはコピーしておいて下さい。
-
「ファイル」>書き出し形式>PostScriptを選択し、任意の場所にPSファイルを出力します。
- Acrobat Distillerを起動し、[設定]メニュー>[Adobe PDF設定の追加]から手順1でダウンロードした「LOGOSWARE FLIPPER.joboptions」を読み込みます。
※ 読み込むと、デフォルト設定:LOGOSWARE FLIPPER になります
- 手順3で出力したPSファイルをAcrobat Distillerにドラッグ&ドロップします。
この時、以下の確認画面表示されますので、「はい」をクリックします。
-
PDFの変換作業が始まり、手順2のPDFに対して上書き保存されます。
※ 上書き保存されたPDFはテキスト抽出可能なPDFとなりました。
- 手順6のPDFを利用してFLIPPERで作成を行ってください。
3)その他:PDF内部構造の階層を変える方法
上記1)2)の作業で透明効果などが崩れてしまった場合は、内部構造の階層を変える事でテキスト抽出ができるようになるケースもあります。
※ この方法は操作ミスが発生しやすいため、原本のPDFは必ずコピーしてからお試しください。
以下図の場合、「フォーム XObject」配下にある「コンテナ」の階層を「フォーム XObject」の上に移動させるとテキスト抽出ができるようになります。
関連情報
トラブルが解決しない場合は?
ご自身での解決ができなかった場合は「トラブルが解決しない場合は?」をご確認いただくか、以下のバナーをクリックしてAIヘルプデスクにお問い合わせください。