プロンプト、RAGコーパス、エージェントワークフローを含むLLM知識入力をテストするための評価フレームワーク。
oh-my-knowledgeは、LLM知識入力を体系的に評価および改善するために設計された評価フレームワークです。評価されるアーティファクト(プロンプト、RAGコーパス、スキル、エージェントワークフロー)を変化させながら、モデルを修正することができます。このフレームワークは、信頼性が高く再現可能な評価結果を保証するために、組み込みの統計的厳密さを提供します。
GitHubからリポジトリをクローンし、依存関係をインストールします。このツールは、Claudeや他のLLMと統合されるPythonベースのフレームワークとして設計されています。詳細なセットアップ手順はプロジェクトのドキュメントに記載されています。ユーザーは評価シナリオを定義し、LLMアーティファクトに対して統計分析を実行できます。
Thesis Structure Helper assists students and researchers in organizing their academic theses by providing…
作成者 FormAI
Dependency Auditor helps developers audit project dependencies for security vulnerabilities, licensing is…
作成者 EnergyAI
FAQ Generator Pro auto-generates FAQ pages from support tickets, documentation, and product information.…
作成者 EmailForge