EBSCO How EBSCO Ensures the Accuracy of Its AI
EBSCO では、AI の回答に対して品質が満たされ、時間の経過とともに劣化しないことを保証するため、品質の評価を実施しています。 AI パイプラインの各ステージで、品質が測定されたり、品質を向上させるための手順が取られたり、意図しないエラーを導入して品質を低下させることがあります。 そのため、バイアス・コスト・環境への影響・平等性といった尺度に加え、あらゆる段階で品質を評価することが重要です。 AI 機能の出力の質を確保するため、以下の手法を使用しています。
Retrieval-Augmented Generation(RAG)
AI は信頼性の高いコンテンツの基礎の上に構築されており、
AI が不正確な情報や根拠のない情報を生成する「ハルシネーション」の発生を大幅に減少します。
AI は検証された包括的な情報に基づく回答を基にすることで、信頼性が高く、コンテクスト的に正確で、信頼できるアウトプットを作成する能力が向上します。 レイテンシー(AI がタスクを完了する際の遅さ)・アップ/ダウンタイム(利用する必要があるときにシステムの信頼性)などの
システムの評価、 コストと環境効率(節約と地球への責任)・セキュリティとプライバシーガードレール・迅速なエンジニアリング査読(バイアスを減らすのに役立ちます)・温度制御(AI の回答の信頼度閾値のようなもの)・システムレベルのガードレールなどを備えた構成になっています。
図書館員と主題分野の専門家(SME)による厳密な審査
弊社の AI 機能は、研究者・図書館員・教育者など、さまざまなユーザーグループによって厳密なテストおよび慎重に審査され、AI が効果的に、かつ責任を持って研究プロセスに統合されることを保証しています。
この包括的なテストプロセスを通じて、貴重なフィードバックを集め、各機能をより洗練させ、精度・ユーザビリティ・倫理的責任という最高水準を満たしています。
開発を通じてエンドユーザーを巻き込むことで、私たちの AI ツールが学術研究のプロセスを真正にサポートし、向上させ、学術研究の複雑さと完全性を尊重した洞察と効率性を提供することを保証します。
責任ある AI へのコミットメントにより、私たちの技術が学術コミュニティのニーズや期待に沿ったものになり、あらゆる段階での信頼と信頼性を育みます。
Sample Rubric for Assessing AI Responses
EBSCO 社が AI のレスポンス評価尺度に使用するサンプルルーブリック:
- Timeliness:Insight に掲載されている情報は最新で、古い情報ではないですか?
- トーン:Insight の情報は記事のトーンと一致していますか?
- 用語:Insightの用語は記事の内容と一致していますか?
- 正確性:Insightの情報は記事の詳細に基づいて正確ですか?
- テーマ:Insightがカバーしている記事の主要なテーマはありますか?有
- 用性:Insightは抄録および/または研究の補完資料として有用でしたか?
EBSCO は常に高品質で信頼できるデータに取り組んできましたが、AI の品質も同様です。
最新情報はこちらから
EBSCO の AI に関する詳細、AI ベータプログラム参加のお申し込み、研究開発の取り組みにおけるコラボレーションに関しては、下記リンクよりお問い合わせください。