@sparse-autoencoder-training
SAELens 是用于训练和分析稀疏自动编码器 (SAE) 的主要库,稀疏自动编码器是一种将多语义神经网络激活分解为稀疏、可解释特征的技术。基于 Anthropic 对单义性的开创性研究。