メタデータ、RAGの高精度化のためのデータ加工用内蔵GUIツールを強化

2025年10月22日
お知らせ

~ RAG製品「ChatBrid」の標準対応文書形式を拡充しマークダウン化の精度を向上

メタデータ株式会社(所在地:東京都文京区、代表取締役社長:野村直之)は、同社の高精度RAGエンジン「ChatBrid(チャットブリッド)」に標準搭載するデータ加工用GUIツールを強化しました。今回のアップデートでは、標準対応の文書形式を拡充し、Markdown(マークダウン)形式への変換精度を向上。ナレッジ取り込み前の整形作業をアプリ内で完結でき、RAG全体の精度・速度・運用性を底上げします。本日より、順次ロールアウトしてまいります。

     (画像①:ファイル取り込み画面のイメージ)

背景

RAGの回答精度は、ソース文書の品質に大きく依存します。実務では、Word・Excel・PowerPoint・PDF・テキスト・CSVなど多様な形式を日々扱いますが、これらをAIに最適なMarkdownテキストへ整形する工程は、手作業や外部ツールの併用になりがちでした。ChatBridでは、取り込みと整形を内蔵GUIで一気通貫にし、だれでも短時間で“学習しやすい文書”へ加工できる環境を目指しています。Difyのように、加工フローを図で定義したり加工ツールを自作する必要なく、引き続き完全ノーコードで、ごく少ない操作で高品質なMarkdownテキストへ、ひいては高精度なRAGを迅速に作成することができます。

アップデートのポイント

1. 標準対応形式の拡充

  • テキスト(.txt)
  • Word(.docx)
  • Excel(.xlsx)
  • PowerPoint(.pptx)
  • PDF (2023年より対応)
  • CSV(ChatBridのCSV出力機能で生成したファイルを推奨;その加工は可)

 ※今後さらに様々なメディア対応に拡充予定。

2. Markdown化の精度向上と選べる変換モード

ヘッドラインの階層構造(大見出し、中見出し、小見出し…)を使わないなど、文書が表す知識の構造を素直に反映していないPowerPointやExcel、レイアウトが複雑なWordは、ファイル形式の特性上、変換精度が下がる場合があります(画像①の注意文をアプリにも掲示)。

そこで、「人間にとっての見た目」を重視して作られてしまった文書を、AIに理解しやすい、知識の論理構造を反映したものに改善するフローを、画像②の通り、いくつか提供しています。

  • 即時変換:構造が比較的単純なPDFや一般的なオフィス文書を、内蔵コンバータで高速にMarkdown化。
  • 高精度変換:複雑レイアウトや表が多い文書は、LLMを用いた高精度Markdown化を選択可能(時間はかかるが整形品質を重視)。
  • 直接貼り付け:すでにMarkdownなら、そのまま貼り付けで即取り込み。
  • 推奨CSV:適切に整形済みのCSVは、そのままデータセット化して利用可能。

3. 取り込み後の整形支援

  • 見出し(#)や箇条書き(-)のMarkdown構造をビジュアルに編集可能な整形アシスト機能。
  • 変換結果のプレビュー/再変換をワンクリックで実行。

期待効果

  • 回答精度の底上げ:Markdownに正規化されたソースは分割(チャンク化)と検索の質が向上し、RAGの再現性・一貫性が高まります。
  • 導入・運用コストの削減:外部ツール併用が減り、前処理の手戻りを削減。
  • 現場主導の運用:専門知識がなくてもGUIだけで変換・整形・登録まで完了。

■ 提供開始

  • 本日より順次ロールアウト(ChatBrid標準機能として提供)


Contact

弊社のサービス・APIについてお気軽にご連絡・ご相談ください

> お問い合わせはこちらから <