Posts

Synthesizer: Rethinking Self-Attention for Transformer Models

Paper-reading notes: Synthesizer

Paper-reading notes: Learning Transformer Programs

Paper-reading notes: Reformer

Paper-reading notes: OpenVLA

Paper-reading notes: MOTPE

Paper-reading notes: Bayesian Optimization

Paper-reading notes: Random Search for Hyper-Parameter Optimization

Paper-reading notes: ALTA

Paper-reading notes: Tracr

Paper-reading notes: RASP