LangKit讓大語(yǔ)言模型安全可靠
LangKit 是一個(gè)用于監(jiān)控語(yǔ)言模型的開源文本度量工具包。它提供了一系列用于從輸入和/或輸出文本中提取相關(guān)信號(hào)的方法,這些方法與開源數(shù)據(jù)記錄庫(kù) whylogs 兼容。
當(dāng)前支持的 metrics 包括:
- 文本質(zhì)量
- 可讀性分?jǐn)?shù)
- 復(fù)雜性和成績(jī)分?jǐn)?shù)
- 文本相關(guān)性
- 提示/響應(yīng)之間的相似性分?jǐn)?shù)
- 與用戶定義主題的相似度分?jǐn)?shù)
- 安全和隱私
- patterns - 匹配用戶定義的正則表達(dá)式模式組的字符串計(jì)數(shù)
- 越獄 - 與已知越獄嘗試的相似度分?jǐn)?shù)
- 提示注入 - 與已知提示注入攻擊的相似度分?jǐn)?shù)
- 拒絕 - 與已知的 LLM 拒絕服務(wù)響應(yīng)相關(guān)的相似度分?jǐn)?shù)
- 情緒和毒性
- 情感分析
- 毒性分析
評(píng)論
圖片
表情
