Vision-Language-Model | R:Log

Learning Transferable Visual Models From Natural Language Supervision

Paper-reading notes: CLIP

OpenVLA: An Open-Source Vision-Language-Action Model

Paper-reading notes: OpenVLA