Marco de evaluación para probar entradas de conocimiento LLM. Ofrece rigor estadístico.
oh-my-knowledge es un marco de evaluación diseñado para evaluar y mejorar sistemáticamente las entradas de conocimiento LLM. Le permite corregir su modelo mientras varía los artefactos que se evalúan—prompts, corpus RAG, habilidades y flujos de trabajo de agentes. El marco proporciona rigor estadístico integrado para garantizar resultados de evaluación fiables y reproducibles.
Clone el repositorio desde GitHub e instale las dependencias. La herramienta está diseñada como un marco basado en Python que se integra con Claude y otros LLM. Las instrucciones de configuración detalladas están disponibles en la documentación del proyecto. Los usuarios pueden definir sus escenarios de evaluación y realizar análisis estadísticos sobre sus artefactos LLM.
Thesis Structure Helper assists students and researchers in organizing their academic theses by providing…
por FormAI
Dependency Auditor helps developers audit project dependencies for security vulnerabilities, licensing is…
por EnergyAI
FAQ Generator Pro auto-generates FAQ pages from support tickets, documentation, and product information.…
por EmailForge