Align and tell: Boosting text-video retrieval with local alignment and fine-grained supervision

Xiaohan Wang; Linchao Zhu; Zhedong Zheng; Mingliang Xu; Yi Yang

Align and tell: Boosting text-video retrieval with local alignment and fine-grained supervision

Authors: xiaohan-wang Xiaohan Wang, linchao-zhu Linchao Zhu, Zhedong Zheng, Mingliang Xu, yi-yang Yi Yang

Published in IEEE Transactions on Multimedia (TMM), 2022

Recommended citation: Xiaohan Wang, Linchao Zhu, Zhedong Zheng, Mingliang Xu, Yi Yang, "Align and tell: Boosting text-video retrieval with local alignment and fine-grained supervision." IEEE Transactions on Multimedia, 2022. DOI: 10.1109/TMM.2022.3204444
Download PDF: https://zdzheng.xyz/files/2022/TMM22-Xiaohan.pdf

Keywords:

text video retrieval video retrieval local video retrieval object re-identification content-based retrieval

@article{wang2022align,
author = "Wang, Xiaohan and Zhu, Linchao and Zheng, Zhedong and Xu, Mingliang and Yang, Yi",
title = "Align and tell: Boosting text-video retrieval with local alignment and fine-grained supervision",
journal = "IEEE Transactions on Multimedia",
url = "https://zdzheng.xyz/files/2022/TMM22-Xiaohan.pdf",
doi = "10.1109/TMM.2022.3204444",
year = "2022",
publisher = "IEEE" }

Share on

Twitter Facebook LinkedIn