Profilage avancé de nn.Linear dans PyTorch
L'article analyse le profilage d'un nn.Linear dans PyTorch, révélant comment les opérations de transposition et d'addition sont optimisées. Il utilise un NVIDIA A100-SXM4-80GB GPU et des scripts disponibles sur Hugging Face.