Bewertungsrahmen zur Testung von LLM-Wissenseingaben. Bietet statistische Strenge.
oh-my-knowledge ist ein Bewertungsrahmen, der entwickelt wurde, um LLM-Wissenseingaben systematisch zu bewerten und zu verbessern. Es ermöglicht Ihnen, Ihr Modell zu reparieren, während Sie die bewerteten Artefakte variieren—Prompts, RAG-Korpora, Fähigkeiten und Agenten-Workflows. Der Rahmen bietet eingebaute statistische Strenge, um zuverlässige und reproduzierbare Bewertungsergebnisse sicherzustellen.
Klonen Sie das Repository von GitHub und installieren Sie die Abhängigkeiten. Das Tool ist als Python-basiertes Framework konzipiert, das mit Claude und anderen LLMs integriert ist. Detaillierte Installationsanweisungen sind in der Projektdokumentation verfügbar. Benutzer können dann ihre Bewertungsszenarien definieren und statistische Analysen ihrer LLM-Artefakte durchführen.
Thesis Structure Helper assists students and researchers in organizing their academic theses by providing…
von FormAI
Dependency Auditor helps developers audit project dependencies for security vulnerabilities, licensing is…
von EnergyAI
FAQ Generator Pro auto-generates FAQ pages from support tickets, documentation, and product information.…
von EmailForge