Transformer Debugger (TDB) 是由 OpenAI 的 Superalignment 团队开发的一种工具,旨在支持对小型语言模型特定行为的调查。该工具将自动可解释性技术与稀疏自动编码器相结合。
开源地址是:https://github.com/openai/transformer-debugger