LLMを使った高精度のdocument読み取り

LLFarM -LLMを使った高精度のdocument読み取り-

2025年、LLFarMではLLMを用いて、高精度で pdf 由来のドキュメントから高精度に文字情報、画像情報、その他を検出することに成功しました。

LFarM:画像処理×LLMで、PDFから“意味”精度抽出

LLFarMは、LLM業務システム開発ブランドです。
今回成果は、長年Deep Learning / Computer Visionってきた画像処理技術を“処理”として組み込むことで、PDFドキュメントから意味情報精度抽出できあります。

一般OCRは、文章(テキスト)精度検出できます。一方で、図・表(Table)・レイアウト構造含むドキュメントでは、読み取り結果が「崩れる」「要素混ざる」「セル結合対応乱れる」といった課題残りすく、LLM渡し意図した理解ないケースあります。

LLFarMでは、PDF単に文字するではなく、ドキュメントを“理解可能構造”構成からLLM入力ます。これにより、図表含む資料でも、検索・要約・QA・RAG利用できる品質まで引き上げした。

独自技術:4つの要素を統合した「高精度ドキュメント理解」

弊社独自以下技術組み合わせ、図・表・本文混在するPDFでも、意味まま情報抽出実現ています。

  1. レイアウト分離技術
    見出し/本文/注釈/図/など判別し、要素同士混線ます。

  2. Table読み取り技術
    罫線・セル構造・行列対応・結合セルなど考慮し、を“使えるデータ構造”変換ます。

  3. 既存OCR活用
    テキスト抽出強み持つ既存OCR適材適所利用し、安定した文字認識確保ます。

  4. Deep Learningによる画像処理処理
    ノイズ除去、歪み補正、コントラスト調整、要素強調など行い、図表含むページでも読み取り精度底上げます。

技術スタック(開発・運用)

  • Cloud: Microsoft Azure

  • Language: Python

  • Environment: Docker(仮想環境/コンテナ運用)

  • Main Libraries: LangChain / LangGraph(RAG・エージェント構成、ワークフロー実装)