{"id":"1d2ee90f-fe89-41d2-911d-9c8587092518","slug":"clawhub-codenova58-llm-evaluation","name":"Llm Evaluation","description":"Deep LLM evaluation workflow—quality dimensions, golden sets, human vs automatic metrics, regression suites, offline/online signals, and safe rollout gates f...","canonicalUrl":"https://xpersona.co/agent/clawhub-codenova58-llm-evaluation","sourceUrl":"https://clawhub.ai/codenova58/llm-evaluation","homepage":"https://clawhub.ai/codenova58/llm-evaluation","source":"CLAWHUB","vendor":{"slug":"clawhub","label":"Clawhub","url":"https://clawhub.ai/codenova58/llm-evaluation"},"protocols":["OPENCLEW"],"capabilities":[],"trustScore":null,"trustConfidence":"unknown","artifactCount":0,"benchmarkCount":0,"lastRelease":null,"freshnessAt":"2026-04-15T00:41:15.328Z","freshnessLabel":"Apr 15, 2026","securityReviewed":true,"openapiReady":false,"stats":[{"label":"Trust score","value":"Unknown"},{"label":"Compatibility","value":"OpenClaw"},{"label":"Freshness","value":"Apr 15, 2026"},{"label":"Vendor","value":"Clawhub"},{"label":"Artifacts","value":"0"},{"label":"Benchmarks","value":"0"},{"label":"Last release","value":"Unpublished"}],"factsPreview":[{"factKey":"vendor","category":"vendor","label":"Vendor","value":"Clawhub","href":"https://clawhub.ai/codenova58/llm-evaluation","sourceUrl":"https://clawhub.ai/codenova58/llm-evaluation","sourceType":"profile","confidence":"medium","observedAt":"2026-04-15T00:45:39.800Z","isPublic":true},{"factKey":"protocols","category":"compatibility","label":"Protocol compatibility","value":"OpenClaw","href":"https://xpersona.co/api/v1/agents/clawhub-codenova58-llm-evaluation/contract","sourceUrl":"https://xpersona.co/api/v1/agents/clawhub-codenova58-llm-evaluation/contract","sourceType":"contract","confidence":"medium","observedAt":"2026-04-15T00:45:39.800Z","isPublic":true},{"factKey":"handshake_status","category":"security","label":"Handshake status","value":"UNKNOWN","href":"https://xpersona.co/api/v1/agents/clawhub-codenova58-llm-evaluation/trust","sourceUrl":"https://xpersona.co/api/v1/agents/clawhub-codenova58-llm-evaluation/trust","sourceType":"trust","confidence":"medium","observedAt":null,"isPublic":true}],"highlights":["Trust evidence available"],"agentCard":{"name":"Llm Evaluation","description":"Deep LLM evaluation workflow—quality dimensions, golden sets, human vs automatic metrics, regression suites, offline/online signals, and safe rollout gates f...","source":"CLAWHUB","sourceId":"clawhub:s173fekm3yw84k7gp861dme7dd83gvyf:llm-evaluation","homepage":"https://clawhub.ai/codenova58/llm-evaluation","repository":"https://clawhub.ai/codenova58/llm-evaluation","documentation":"https://xpersona.co/agent/clawhub-codenova58-llm-evaluation","protocols":["OPENCLEW"]}}