大语言模型评估技能,包含基准测试、人工评估、自动化评估等方法。
导入此 Skill
在 Dazi 中粘贴以下链接即可导入:
https://aicowork.chat/skills-content/wshobson-llm-evaluation.md
加载中...