RAG製品ChatBridに、自動型推定で「近い日時」などを正確に認識させて高精度化や知識範囲を限定できる機能をリリース

2025年12月16日
プレスリリース

メタデータ株式会社(所在地:東京都文京区、代表取締役社長:野村直之)は、同社の高精度RAG(Retrieval-Augmented Generation)製品ChatBridにおいて、CSV などの知識レコードに含まれる 日付・時刻・数値・真偽値などの属性を自動推定し、型ごとに最適な絞り込み・類似度判定を行う新機能 を2026年2月にリリースいたします。

生成AIを用いた企業内検索では、従来の「すべてを文字列として扱う」仕組みが、誤った類似判定や不適切な検索結果の原因となっていました。今回のアップデートにより、ChatBridはデータの属性を理解したうえで、意味に沿った絞り込み・ランキングを行えるようになり、実務精度が顕著に向上します。

機能概要

1. CSV など取り込みデータの「自動型推定」

(文字列/整数/小数/日付/日時/真偽値 など)
ChatBridは多カラムのCSVデータを取り込み可能ですが、AI により、各カラムの値から最適なデータ型を自動推定します。これにより、企業のログデータ、売上データ、問い合わせ記録など、形式が混在している現場データでも、ユーザー側で型定義する必要がありません。数字が名称に過ぎない時などに、自動推定の結果は可能な範囲で別の型に変更可能です。

  図  データ型自動推定結果の例

2. 型ごとに最適化された「絞り込みフィルタ」を実装

従来はすべて文字列扱いで検索していたため、

  • 数値の範囲検索
  • 日付の期間検索
  • 真偽値の切り替え検索
    などが正確に実行できませんでした。

今回より以下が可能になります:

データ型新しい絞り込み方法
文字列部分一致・前方一致など従来のテキスト検索
整数・小数> < >= <= による範囲条件
日付・時刻「一週間以内」「指定期間内」などの時間軸フィルタ
真偽値True / False の切替

3. 型に応じた意味のある類似度計算に対応

従来の類似度判定は、tokenizerによっては以下のような誤判定を生む課題がありました。

  • 3.3ミリグラム」と「33日」が類似と判断される
  • 2/28」と「3/1」が文字面ではまったく異なるため遠いと判定される

今回のアップデートにより:

  • 日付は時間的な距離で類似性を評価(例:2/28 3/1 1日差類似度が高い)
  • 数値は大小関係で近さを判断
  • 文字列は従来通り、意味ベースの類似度を適用

これらが組み合わせられ、より人間の判断に近い高精度ランキングが実現されます。

導入メリット

1. RAG の検索精度が顕著に向上

データ型ごとに意味に沿った類似度が算出されるため、
「必要なレコードが引けない」「関係のない項目が上位に出てくる」
といった悩みが解決します。


2. 誤判定の防止(文字列検索の限界を突破)

従来の LLM 系ツールでは、

  • 数値と日付
  • 単位付き数値とテキスト
    などが誤って混同されるケースが多く、実務利用の障壁でした。

ChatBrid の型認識により、これらの“AI による誤解”が解消されます。


3. ビジネスで重要な「期間指定」「閾値検索」が可能に

例:

  • 「直近1週間で起きた事故レポートを抽出」
  • 「売上金額が1,000万円以上の案件のみ表示」
  • 「年度内の問い合わせ件数の傾向を分析」

これまで手動で Excel などを使っていたフィルタリングを事前に行ってデータを入れ替えたりする必要がなくなり、ChatBrid 内で完結できるようになります。一時的な変更の際などに特に便利です。


今後の方向性など

今回の型推定と型対応検索は、ChatBrid が進める

RAG の可観測性・正確性・ビジネス適用性の向上」

の中心的なアップデートです。

ChatBrid は今後も

  • マルチモーダルデータ取り込み
  • 重要語抽出・ランキング強化
  • 業種別ドメインモデルとの連携
    など、企業内ナレッジ活用を最大化する方向で進化を続けていきます。

Contact

弊社のサービス・APIについてお気軽にご連絡・ご相談ください

> お問い合わせはこちらから <