Selected Publications

*: indicating equal contribution or alphabetic ordering.

For all publications, please see Google scholar.

Act to See: Emergent Active Visual Perception in Video CoT via Tool Use.
Martin Q. Ma, Yuxiao Qu, Willis Guo, Aditya Agrawal, Paul Pu Liang, Ruslan Salakhutdinov, Louis-Philippe Morency.
Under Submission, 2025.
Paper, Code

Video Active Perception: Efficient Inference-Time Long-Form Video Understanding with Vision-Language Models.
Martin Q. Ma, Willis Guo, Aditya Agrawal, Ankit Gupta, Paul Pu Liang, Ruslan Salakhutdinov, Louis-Philippe Morency.
ICCV workshop, 2025.
[Paper], Code

Seamless Interaction: Dyadic Audiovisual Motion Modeling and Large-Scale Dataset
Agrawal, Vasu, Akinniyi Akinyemi, Kathryn Alvero, Morteza Behrooz, Julia Buffalini, Fabio Maria Carlucci, Joy Chen et al.
In submission, 2025.
[Paper],[Code]

Factorized Contrastive Learning: Going Beyond Multi-view Redundancy
Paul Pu Liang*, Zihao Deng*, Martin Q. Ma*, James Zou, Louis-Philippe Morency, Ruslan Salakhutdinov.
Conference on Neural Information Processing Systems (NeurIPS) 2023.
[Paper], [Code]

Understanding Masked Autoencoders via Hierarchical Latent Variable Models
Lingjing Kong*, Martin Q. Ma*, Guangyi Chen, Eric Xing, Yuejie Chi, Louis-Philippe Morency, Kun Zhang.
Highlight, The IEEE / CVF Computer Vision and Pattern Recognition Conference (CVPR) 2023.
[Paper], [Video], [Slides], [Code]

Face-to-Face Contrastive Learning for Social Intelligence Question-Answering
Alex Wilf*, Martin Q. Ma*, Paul Pu Liang, Amir Zadeh, Louis-Philippe Morency
International Conference on Automatic Face and Gesture Recognition (FG) 2023.
[Paper], [Code]

Conditional Contrastive Learning with Kernel
Yao-Hung Hubert Tsai*, Tianqin Li*, Martin Q. Ma, Han Zhao, Kun Zhang, Louis-Philippe Morency, Ruslan Salakhutdinov.
International Conference on Learning Representations (ICLR) 2022.
[Paper], [Code]

Conditional Contrastive Learning for Improving Fairness in Self-Supervised Learning
Martin Q. Ma, Yao-Hung Hubert Tsai, Paul Pu Liang, Han Zhao, Kun Zhang, Ruslan Salakhutdinov, Louis-Philippe Morency.
Neural Information Processing Systems Workshop on Self-Supervised Learning - Theory and Practice (NeurIPS SSL) 2022.
[Paper], [Code]

Self-supervised Representation Learning with Relative Predictive Coding
Yao-Hung Hubert Tsai*, Martin Q. Ma*, Muqiao Yang, Han Zhao, Louis-Philippe Morency, Ruslan Salakhutdinov.
International Conference on Learning Representations (ICLR) 2021.
Neural Information Processing Systems Workshop on Self-Supervised Learning - Theory and Practice (NeurIPS SSL) 2020.
[Paper], [Code]

Multimodal Routing: Improving Local and Global Interpretability of Multimodal Language Analysis
Yao-Hung Hubert Tsai*, Martin Q. Ma*, Muqiao Yang*, Ruslan Salakhutdinov, Louis-Philippe Morency.
Empirical Methods in Natural Language Processing (EMNLP) 2020.
[Paper], [Code]

Complex Transformer: A Framework for Modeling Complex-Valued Sequence
Muqiao Yang*, Martin Q. Ma*, Dongyu Li*, Yao-Hung Hubert Tsai, Ruslan Salakhutdinov
International Conference on Acoustics, Speech and Signal Processing, (ICASSP) 2020
Oral, Neural Information Processing Systems Science meets Engineering of Deep Learning Workshop (NeurIPS SEDL) 2019.
[Paper], [Video], [Slides], [Code]