用于测试LLM知识输入的评估框架,包括提示、RAG语料库和代理工作流程。
oh-my-knowledge是一个评估框架,旨在系统地评估和改进LLM知识输入。它允许您在评估的工件(提示、RAG语料库、技能和代理工作流程)变化的情况下修复您的模型。该框架提供内置的统计严谨性,以确保可靠和可重复的评估结果。
从GitHub克隆存储库并安装依赖项。该工具被设计为一个基于Python的框架,可以与Claude和其他LLM集成。详细的设置说明在项目文档中提供。用户可以定义他们的评估场景并对他们的LLM工件进行统计分析。
Thesis Structure Helper assists students and researchers in organizing their academic theses by providing…
作者 FormAI
Dependency Auditor helps developers audit project dependencies for security vulnerabilities, licensing is…
作者 EnergyAI
FAQ Generator Pro auto-generates FAQ pages from support tickets, documentation, and product information.…
作者 EmailForge