2025年度论文【268篇】-视频与视觉技术国家工程研究中心

位置 : 首页 > 论文

2025年度论文【268篇】

视频与视觉技术国家工程研究中心

国际期刊（International Journal）

1. Zhipeng Huang*, Jianhao Ding*, Zhiyu Pan, Haoran Li, Ying Fang, Jian K Liu, Zhaofei Yu. Converting High-Performance and Low-Latency SNNs through Explicit Modelling of Residual Error in ANNs IEEE Transactions on Neural Networks and Learning Systems. Vol.36, No.9, pp.16788-16802,Sept.2025 【PDF】

2. Yuxin Zhang, Mingbao Lin, Mingliang Xu, Yonghong Tian, Rongrong Ji. Spatial Re-Parameterization for N: M Sparsity IEEE Transactions on Pattern Analysis and Machine Intelligence. Vol.47, No.9, .7704-7714,Sept.2025 【PDF】

3. Yuanhong Tang, Shanshan Jia, Tiejun Huang, Zhaofei Yu, Jian K Liu. Implementing feature binding through dendritic networks of a single neuron Neural Networks. Vol.190, pp.107680,Sept.2025 【PDF】

4. Changqing Su, Yanqin Chen, Zihan Lin, Zhen Cheng, You Zhou, Bo Xiong, Zhaofei Yu, and Tiejun Huang. Inter-event interval microscopy for event cameras Photonics Research. Vol.13, No.10, pp.2843-2853,Sept.2025 【PDF】

5. Jie Yu, Songping Mai, Peng Zhang, Yucheng Jiang, Jian Cheng. Mixed-Precision Post-Training Quantization for Learned Image Compression. IEEE Internet of Things Journal. Vol.12, No.6, pp.34392-34405,Aug.2025 【PDF】

6. Xiaofeng Huang, Jiaqing Lin, Fengguang Liu, Wen Ji, Haibing Yin, Siwei Ma. Efficient Hardware Architecture Design of K-Means Clustering Algorithm for AV1 Palette Mode Coding IEEE Transaction Circuits System II Express Briefs. Vol.72, No.8, pp.1078- 1082,Aug.2025 【PDF】

7. Yabin Zhu , Xiao Wang, Chenglong Li , Bo Jiang , Lin Zhu , Zhixiang Huang, Yonghong Tian, Jin Tang. CRSOT: Cross-Resolution Object Detection Using Unaligned Frame and Event Cameras IEEE Transactions on Multimedia. Vol.27, No.1, .6529-6542,Aug.2025 【PDF】

8. Jianhao Ding*; Jiyuan Zhang*; Tiejun Huang; Jian K. Liu; Zhaofei Yu. Assisting Training of Deep Spiking Neural Networks With Parameter Initialization IEEE Transactions on Neural Networks and Learning Systems. Vol.36, No.8, pp.15015-15028,Aug.2025 【PDF】

9. Mengya Han, Yong Luo, Han Hu, Zengmao Wang, Lefei Zhang, Bo Du, Ling-Yu Duan, Dacheng Tao. DM-PCL: Text-Driven Dual-Modal Prototype Consistency Learning for Weakly-Supervised Few-Shot Part Segmentation International Journal of Computer Vision. Vol.133, No.11, pp.7553--7569,Aug.2025 【PDF】

10. Yucheng Jiang, Songping Mai, Peng Zhang, Junwei Hu, Jie Yu, Jian Cheng. Enhancing real-time UHD intra-frame coding with parallel-serial hybrid neural networks. Displays. Vol.88, No.1, pp.103034,July 2025 【PDF】

11. Rui Ma, Hou Yi, Chenxuan Li, Huizhu Jia, Xiaodong Xie. Scene-Adaptive Unsupervised Crowd Counting for Video Surveillance IEEE Transactions on Circuits and Systems for Video Technology. Vol.35, No.7, pp.6910-6925,July 2025 【PDF】

12. Xu Liu, Xiaopeng Fan, Jianing Li, Dianze Li, Wei Zhang, Zhengyu Ma, Yonghong Tian. High-Rate Monocular Depth Estimation via Cross Frame-Rate Collaboration of Frames and Events International Journal of Computer Vision. Vol.133, No.10, .7332-7351,July 2025 【PDF】

13. Ruohua Shi, Zhaochen Liu, Lingyu Duan, Tingting Jiang. Amodal Segmentation for Laparoscopic Surgery Video Instruments Sensing and Imaging. Vol.26, No.1, pp.79,June 2025 【PDF】

14. Tianci Li, Xiaofeng Huang, Yansong Li, Nemin Qiu, Haibing Yin, Chuang Zhu, Yuan Li. An FPGA Accelerator Design of Spiking Neural Network for Energy-Efficient Object Detection IEEE Transaction Consumer Electron. Vol.72, No.2, pp.5898?- 5907,May 2025 【PDF】

15. Wenrui Li, Penghong Wang, Xingtao Wang, Wangmeng Zuo, Xiaopeng Fan, Yonghong Tian. Multi-Timescale Motion-Decoupled Spiking Transformer for Audio-Visual Zero-Shot Learning IEEE Transactions on Circuits and Systems for Video Technology. Vol.35, No.11, .10772-10786,May 2025 【PDF】

16. Xiao Wang, Yao Rong, Zongzhen Wu, Lin Zhu, Bo Jiang, Jin Tang, Yonghong Tian. SSTFormer: Bridging Spiking Neural Network and Memory Support Transformer for Frame-Event-Based Recognition IEEE Transactions on Cognitive and Developmental Systems. Vol.17, No.6, .1488-1502,May 2025 【PDF】

17. Xiaoxuan Ma, Jiajun Su, Yan Xu, Wentao Zhu, Chunyu Wang, Yizhou Wang. VMarker-Pro: Probabilistic 3D Human Mesh Estimation from Virtual Markers IEEE Transactions on Pattern Analysis and Machine Intelligence. Vol.47, No.5, pp.3731-3747,May 2025 【PDF】

18. Xiawu Zheng, Yuexiao Ma, Teng Xi, Gang Zhang, Errui Ding, Yuchao Li, Jie Chen, Yonghong Tian, Rongrong Ji. An Information Theory-Inspired Strategy for Automated Network Pruning International Journal of Computer Vision. Vol.133, No.8, .5455–5482,May 2025 【PDF】

19. Youneng Bao, Wen Tan, Chuanmin Jia, Mu Li, Yongsheng Liang, Yonghong Tian. ShiftLIC: Lightweight Learned Image Compression With Spatial-Channel Shift Operations IEEE Transactions on Circuits and Systems for Video Technology. Vol.35, No.9, .9428-9442,Apr.2025 【PDF】

20. Rinyoichi Takezoe, Hao Chen, Gang Shen, Xuefei Lv, Yaowei Wang, Shiliang Zhang, Xiaoyu Wang. Context-Assisted Active Learning for Weakly Supervised Person Search ACM Transactions on Multimedia Computing, Communications, and Applications. Vol.21, No.138, 1-20,Mar.2025 【PDF】

21. Zhongyu Liang, Tong Bu, Zijian Lyu, Zhentao Liu, Ales Hrabec, Leran Wang, Yankun Dou, Jianhao Ding, Peipei Ge, Wenyun Yang, Tiejun Huang, Jinbo Yang, Laura J. Heyderman, Yunquan Liu, Zhaofei Yu, Zhaochu Luo. Ultrafast Probabilistic Neuron in an Artificial Spin Ice for Robust Deep Neural Networks Advanced Functional Material. Vol.35, No.11, pp.2417334,Mar.2025 【PDF】

22. Hao Chen, Francois Bremond, Nicu Sebe, and Shiliang Zhang. Anti-Forgetting Adaptation for Unsupervised Person Re-Identification IEEE Transactions on Pattern Analysis and Machine Intelligence. Vol.47, 1056-1072,Mar.2025 【PDF】

23. Zhile Yang, Shangqi Guo*, Ying Fang, Zhaofei Yu, Jian K Liu.. Spiking Variational Policy Gradient for Brain Inspired Reinforcement Learning IEEE Transactions on Pattern Analysis and Machine Intelligence. Vol.47, No.3, pp.1975-1990,Mar.2025 【PDF】

24. Yunyao Yan, Guoqing Xiang, Jie Chen, Xiaofeng Huang, Peng Zhang, Huizhu Jia, Xiaodong Xie. Hardware-friendly rate estimation algorithm and architecture design for avs3 Multimedia Tools and Applications. Vol.84, pp.38777-38795,Mar.2025 【PDF】

25. Zehong Ma, Hao Chen, Wei Zeng, Limin Su, Shiliang Zhang. Multi-modal Reference Learning for Fine-grained Text-to-Image Retrieval IEEE Transactions on Multimedia. Vol.27, 5009-5022,Feb.2025 【PDF】

26. Zhanzhou Feng, and Shiliang Zhang. Evolved Hierarchical Masking for Self-Supervised Learning IEEE Transactions on Pattern Analysis and Machine Intelligence. Vol.47, 1013-1027,Feb.2025 【PDF】

27. Qichao Ma. Inner-Probe: Discovering Copyright-related Data Generation in LLM Architecture IEEE Transactions on Artificial Intelligence. Dec.2025 【PDF】

28. Yu Liang, Yufeng Zhang, Shiliang Zhang, Sheng Xiao, Rong Xiao, Xiaoyu Wang, Kenli Li. SA-BCT: Self-Adapting Backward-Compatible Training IEEE Transactions on Multimedia. Dec.2025 【PDF】

29. Yihui Zhou, Hao Chen, Zhanzhou Feng, Shiliang Zhang. Efficient Human Feature Refinement for Weakly Supervised Group Activity Recognition IEEE Transactions on Multimedia. Dec.2025 【PDF】

30. Peixuan Zhang, Shuchen Weng, Jiajun Tang, Si Li, Boxin Shi. Towards deeper emotional reflection: Crafting affective image filters with generative priors IEEE Transactions on Pattern Analysis and Machine Intelligence. Dec.2025 【PDF】

31. Peixuan Zhang, Shuchen Weng, Chengxuan Zhu, Binghao Tang, Zijian Jia, Si Li, Boxin Shi. Affective image editing: Shaping emotional factors via text descriptions International Journal of Computer Vision. Dec.2025 【PDF】

32. Jing Peng, Shanshan Jia, Jiyuan Zhang, Yongxing Wang, Zhaofei Yu, Jian K Liu. Decoding natural visual scenes via learnable representations of neural spiking sequences Neural Networks. Vol.192, pp.107863,Dec.2025 【PDF】

33. Zhen Chen, Hao Tang, Shiliang Zhang. Generalization-Preserving Adaptation of Vision-Language Models for Open-Vocabulary Segmentation Computer Vision and Image Understanding. Vol.261, 1-13,Nov.2025 【PDF】

34. Yuhao Xiao, Wenxuan Liu, Wenxin Huang, Jie Ma, Ryan Wen Liu, and Xian Zhong. TCP: Text-Guided Cascade Network for PedestrianCrossing Intention Prediction IEEE Transactions on Intelligent Transportation Systems. pp.1-11,Nov.2025 【PDF】

35. Lan Chen , Dong Li, Xiao Wang, Pengpeng Shao, Wei Zhang, Yaowei Wang, Yonghong Tian, Jin Tang. Retain, Blend, and Exchange：A Quality-Aware Spatial-Stereo Fusion Approach for Event Stream Recognition IEEE Transactions on Multimedia. Vol.27, No.1, .8926-8939,Nov.2025 【PDF】

36. Ronghua Fu, Zhimeng Huang, Maosen Cao, Drahomír Novák, Chunhui Xie, Jinwen Huang. Optimizing deep learning-driven computer vision for civil infrastructure defect Identification: Challenges and strategies Engineering Applications of Artificial Intelligence. Vol.158, pp.111521,Oct.2025 【PDF】

37. Yujia Liu, Chenxi Yang, Zhaofei Yu, Tiejun Huang. Enhancing NR-IQA Model Robustness through Simple Image Compression Techniques IEEE Transactions on Circuits and Systems for Video Technology. Vol.35, No.10, pp.9979-9985,Oct.2025 【PDF】

38. Yuanlin Wang, Yiyang Zhang, Ruiqin Xiong, Jian Zhang, Xinfeng Zhang, Tiejun Huang. Super-Resolving Dynamic Scenes With Spike Camera via Multi-Frame Sequential Alignment With Motion Propagation IEEE Transactions on Image Processing. Vol.34, pp.6537-6549,Oct.2025 【PDF】

39. Xuejian Huang, Tinghuai Ma, Hao Tang, Huan Rong. Knowledge-Enhanced Dynamic Scene Graph Attention Network for Fake News Video Detection IEEE Transactions on Multimedia. Oct.2025 【PDF】

40. Miaohui Wang, Yunheng Liu, Wuyuan Xie, Boxin Shi, Jianmin Jiang. Efficient 3D surface super-resolution via normal-based multimodal restoration IEEE Transactions on Pattern Analysis and Machine Intelligence. Oct.2025 【PDF】

41. Jianhao Ding, Zhaofei Yu, Jian K. Liu, Tiejun Huang. Neuromorphic computing paradigms enhance robustness through spiking neural networks Nature Communications. Vol.16, pp.10175,Oct.2025 【PDF】

42. Gaole Dai, Rongyu Zhang, Qingpo Wuwu, Cheng-Ching Tseng, Yu Zhou, Shaokang Wang, Siyuan Qian, Ming Lu, Ali Ata Tuz, Matthias Gunzer, Tiejun Huang, Jianxu Chen, Shanghang Zhang. Implicit neural image field for biological microscopy image compression Nature Computational Science. No.5, pp.1041-1050,Oct.2025 【PDF】

43. Yucheng Jiang, Songping Mai, Peng Zhang, Jie Yu, Junwei Hu, Jian Cheng. Accelerating Intra-frame Block Partitioning Decision for AVS3 Using Attention Mechanisms Signal Image Video Process. Vol.19, No.13, pp.1141,Oct.2025 【PDF】

44. Songtao Li, Hao Tang. Multimodal Alignment and Fusion: A Survey Springer International Journal of Computer Vision. Oct.2025 【PDF】

45. Chao Li , Tianyi Li, Fanyang Meng , Qingyu Mao , Youneng Bao , Yonghong Tian, Yongsheng Liang. One is All: A Unified Rate-Distortion-Complexity Framework for Learned Image Compression Under Energy Concentration Criteria IEEE Transactions on Multimedia. Vol.27, No.1, .3992-4007,Jan.2025 【PDF】

46. Mengyue Geng, Lizhi Wang, Lin Zhu, Wei Zhang, Ruiqin Xiong, Yonghong Tian. Towards Ultra High-Speed Hyperspectral Imaging by Integrating Compressive and Neuromorphic Sampling International Journal of Computer Vision. Vol.133, No.4, .1587-1610,Jan.2025 【PDF】

47. Hao Li, Da Long, Li Yuan, Yu Wang, Yonghong Tian, Xinchang Wang, Fanyang Mo. Decoupled Peak Property Learning for Efficient and Interpretable Electronic Circular Dichroism Spectrum Prediction Nature Computational Science. Vol.5, No.3, .234-244,Jan.2025 【PDF】

48. Zhiwei Nie, Xudong Liu, Jie Chen, Zhennan Wang, Yutian Liu, Haorui Si, Tianyi Dong, Fan Xu, Guoli Song, Yu Wang, Peng Zhou, Wen Gao, Yonghong Tian. A Unified Evolution-Driven Deep Learning Framework for Virus Variation Driver Prediction Nature Machine Intelligence. Vol.7, No.1, .131–144,Jan.2025 【PDF】

49. Siwei Ma, Shenpeng Song, Bolin Chen, Qi Mao, Xiaohan Fang, Chuanmin Jia, Shiqi Wang. Generative Coding: Promise and Challenges Asia Pacific Signal and Information Processing Association Transactions on Signal and Information Processing. Vol.14, No.1, Sept.2025 【PDF】

50. Liying Wang, Xiaoli Zhang, Chuanmin Jia, Siwei Ma. MAFS: Masked Autoencoder for Infrared-Visible Image Fusion and Semantic Segmentation IEEE Transactions on Image Processing. Vol.34, pp.6490-6505,Sept.2025 【PDF】

51. Junlong Gao, Zhimeng Huang, Qi Mao, Siwei Ma, Chuanmin Jia. Exploring Multimodal Knowledge for Image Compression via Large Foundation Models IEEE Transactions on Image Processing. Vol.34, pp.5904-5919,Sept.2025 【PDF】

52. Siqi Zhang, Qizhe Zhang, Shanghang Zhang, Xiaohong Liu, Jingkun Yue, Ming Lu, Huihuan Xu, Jiaxin Yao, Xiaobao Wei, Jiajun Cao, Xiang Zhang, Ming Gao, Jun Shen, Yichang Hao, Yinkui Wang, Xingcai Zhang, Ping Zhang, Shuguang Cui, Guangyu Wang. A generalist foundation model and database for open-world medical image segmentation Nature Biomedical Engineering. Sept.2025 【PDF】

53. Haofeng Wang, Yilin Guo, Tiange Zhang, Zehao Li, Tong Yue, Feng Gao and Siwei Ma. RiverEcho-2.0: A Real-Time Interactive System for Yellow River Culture via Enhanced MultiModal Document RAG Transactions on Artificial Intelligence. Vol.1, No.1, pp.212-226,Sept.2025 【PDF】

54. Yanchen Dong, Ruiqin Xiong, Jing Zhao, Xiaopeng Fan, Xinfeng Zhang, Tiejun Huang. Color Spike Camera Reconstruction via Long Short-Term Temporal Aggregation of Spike Signals IEEE Transactions on Image Processing. Vol.34, pp.5312-5324,Aug.2025 【PDF】

55. Xinyu Hang, Ziqing Ge, Hongfei Fan, Chuanmin Jia, Siwei Ma, Wen Gao. Rate-Distortion-Complexity Optimized Framework for Multi-Model Image Compression IEEE Transactions on Image Processing. Vol.34, pp.5385-5399,Aug.2025 【PDF】

56. Shuchen Weng, Xiaocheng Gong, Haojie Zheng, Si Li, Xinlong Wang, Boxin Shi. OpenCIR: Conditional image repainting with open condition mixture IEEE Transactions on Pattern Analysis and Machine Intelligence. Vol.47, No.11, pp.10406-10419,Aug.2025 【PDF】

57. Zhiming Chang, Boyang Liu, Yifei Xia, Youming Guo, Boxin Shi, He Sun. Reconstructing satellites in 3D from amateur telescope images IEEE Transactions on Pattern Analysis and Machine Intelligence. Aug.2025 【PDF】

58. Qian Yin, Haopeng Lu, Mingjia Yang, Ruiqi Li,Yizong Wang, Lili Zhao, Sujia Wang, Xinfeng Zhang, Siwei Ma. Joint Structure-Texture Scan-Order for Point Cloud Attribute Compression Using Affine Transformation ACM Transactions on Multimedia Computing, Communications, and Applications. Vol.21, No.6, pp.1-21,July 2025 【PDF】

59. Hao Tang, Ling Shao, Zhenyu Zhang, Luc Van Gool, Nicu Sebe. Spatial-Temporal Graph Mamba for Music-Guided Dance Video Synthesis IEEE Transactions on Pattern Analysis and Machine Intelligence. July 2025 【PDF】

60. Shanghang Zhang, Bingteng Xie, Xin Zhu, Suwei Dong, Mo Li. Lactylation in cancer: Unveiling new layers of complexity The Innovation. Vol.6, No.7, July 2025 【PDF】

61. Ying Zhu, Hong Liu, Guoliang Hua, Hao Tang, Yidi Li, Weibo Huang. Dual Attention Guidance Network for Self-Supervised Monocular Depth Estimation IEEE Transactions on Circuits and Systems for Video Technology. June 2025 【PDF】

62. Jingqian Wu, Shuo Zhu, Chutian Wang, Boxin Shi, Edmund Y. Lam. SweepEvGS: Event-based 3D gaussian splatting for macro and micro radiance field rendering from a single sweep IEEE Transactions on Circuits and Systems for Video Technology. June 2025 【PDF】

63. Ziqing Ge, Zhimeng Huang, Chuanmin Jia, Siwei Ma, Wen Gao. Rethinking the Functionality of Latent Representation: A Logarithmic Rate-Distortion Model for Learned Image Compression IEEE Transactions on Circuits and Systems for Video Technology. Vol.35, pp.11553-11566,May 2025 【PDF】

64. Qian Yin, Ruoke Yan, Xinfeng Zhang, Siwei Ma. Prediction Enhancement for Point Cloud Attribute Compression using Smoothing Filter IEEE Transactions on Circuits and Systems for Video Technology. Vol.35, No.10, pp.10544-10556,May 2025 【PDF】

65. Zheng Chang, Xinfeng Zhang, Shanshe Wang, Siwei Ma, Wen Gao. STAU: a spatiotemporal-aware unit for video prediction and beyon IEEE Transactions on Pattern Analysis and Machine Intelligence. Vol.47, No.9, pp.7916-7929,May 2025 【PDF】

66. Peiqi Duan, Boyu Li, Yixin Yang, Hanyue Lou, Minggui Teng, Xinyu Zhou, Yi Ma ,Boxin Shi. EventAid: Benchmarking event-aided image/video enhancement algorithms with real-captured hybrid dataset IEEE Transactions on Pattern Analysis and Machine Intelligence. Vol.47, No.8, pp.6959-6973,May 2025 【PDF】

67. Chu Zhou, Minggui Teng, Xinyu Zhou, Chao Xu, Imari Sato, and Boxin Shi. Learning to deblur polarized images International Journal of Computer Vision. Vol.133, pp.5976-5991,May 2025 【PDF】

68. Yujia Liu, Chenxi Yang, Dingquan Li, Tingting Jiang, Tiejun Huang. A Norm Regularization Training Strategy for Robust Image Quality Assessment Models International Journal of Computer Vision. Vol.133, pp.5883-5897,May 2025 【PDF】

69. Zhenglun Kong, Dongkuan Xu, Zhengang Li, Peiyan Dong, Hao Tang, Yanzhi Wang, Subhabrata Mukherjee. AutoViT: Achieving Real-Time Vision Transformers on Mobile via Latency-aware Coarse-to-Fine Search Springer International Journal of Computer Vision. May 2025 【PDF】

70. Shiming Zhang, Kun Shang, Lidong Gong, Qian Xie, Jianfei Sun, Meng Xu, Xunbin Wei, Zhaoheng Xie, Xinyu Liu, Hao Tang, Zhengren Xu, Wei Wang, Haihua Xiao, Zhiqiang Lin, Hongbin Han. Smart Organic–Inorganic Copolymer Nanoparticles Distinguish Between Microglia and Cancer Cells for Synergistic Immunotherapy in Glioma Advanced Science. Apr.2025 【PDF】

71. Yakun Ju, Boxin Shi, Bihan Wen, Kin-Man Lam, Xudong Jiang, Alex C. Kot. Revisiting one-stage deep uncalibrated photometric stereo via Fourier embedding IEEE Transactions on Pattern Analysis and Machine Intelligence. Vol.47, No.8, pp.6185-6199,Apr.2025 【PDF】

72. Xiaoyao Wei, Zongrui Li, Binjie Ding, Boxin Shi, Xudong Jiang, Gang Pan, Yanlong Cao, Qian Zheng. Revisiting supervised learning-based photometric stereo networks IEEE Transactions on Pattern Analysis and Machine Intelligence. Vol.47, No.8, pp.6320-6337,Apr.2025 【PDF】

73. Daochang Liu, Qiyue Li, Anh-Dung Dinh, Tingting Jiang, Mubarak Shah, Chang Xu. DiffAct++: Diffusion Action Segmentation IEEE Transactions on Pattern Analysis and Machine Intelligence. Vol.47, No.3, pp.1644-1659,Mar.2025 【PDF】

74. Ziyuan Luo, Anderson Rocha, Boxin Shi, Qing Guo, Haoliang Li, and Renjie Wan. The NeRF signature: Codebook-aided watermarking for neural radiance fields IEEE Transactions on Pattern Analysis and Machine Intelligence. Vol.47, No.6, pp.4652-4667,Mar.2025 【PDF】

75. Jieji Ren, Wenxin Du, Yueshi Dong, Ningbin Zhang, Heng Guo, Boxin Shi, Jiang Zou, Guoying Gu. Illumination design, modeling, and optimization for camera-based tactile sensor Advanced Intelligent Systems. Vol.7, No.5, pp.2400596,Feb.2025 【PDF】

76. Hao Tang, Ling Shao, Nicu Sebe, Luc Van Gool. Enhanced Multi-Scale Cross-Attention for Person Image Generation IEEE Transactions on Pattern Analysis and Machine Intelligence. Jan.2025 【PDF】

77. Mingyuan Lin, Yangguang Wang, Xiang Zhang, Boxin Shi, Wen Yang, Chu He, Gui-song Xia and Lei Yu. Self-supervised Shutter Unrolling with Events International Journal of Computer Vision. Vol.133, pp.3762–3780,Jan.2025 【PDF】

78. Lianlin Li, Shengguo Hu, Mingyi Li, Jiawen Xu, Hongrui Zhang, Shanghang Zhang, Tie Jun Cui, Philipp del Hougne. Electromagnetic metamaterial agent Light: Science & Applications. Vol.14, No.12, Jan.2025 【PDF】

国际会议（International Conference）

79. Wenxuan Liu, Yao Deng, Kang Chen, Xian Zhong, Zhaofei Yu, Tiejun Huang. SOTA: Spike-Navigated Optimal TrAnsport Saliency Region Detection in Composite-bias Videos in Proceedings of the International Joint Conference on Artificial Intelligence, Montreal, pp.1621-1629, 2025 【PDF】

80. Weihao Tan, Wentao Zhang, Xinrun Xu, Haochong Xia, Ziluo Ding, Boyu Li, Bohan Zhou, Junpeng Yue, Jiechuan Jiang, B?rje F. Karlsson, Bo An, Shuicheng Yan, Zongqing Lu. Cradle: Empowering Foundation Agents towards General Computer Control Forty-Second International Conference on Machine Learning, Vancouver, Canada, 2025 【PDF】

81. Jiechuan Jiang, Zongqing Lu. Best Possible Q-Learning in Proceedings of Conference on Uncertainty in Artificial Intelligence, Corvallis, USA, 2025 【PDF】

82. Penglin Cai, Chi Zhang, Yuhui Fu, Haoqi Yuan, Zongqing Lu. Creative Agents: Empowering Agents with Imagination for Creative Tasks in Proceedings of Conference on Uncertainty in Artificial Intelligence, Corvallis, USA, 2025 【PDF】

83. Yuxuan Wang, Mingzhou Liu, Xinwei Sun, Wei Wang, Yizhou Wang. Bayesian Active Learning for Bivariate Causal Discovery in Proceedings of Forty-second International Conference on Machine Learning, Vancouver, Canada, 2025 【PDF】

84. Long Ma, Fangwei Zhong, Yizhou Wang. Behavior-agnostic Task Inference for Robust Offline In-context Reinforcement Learning in Proceedings of Forty-second International Conference on Machine Learning, Vancouver, Canada, 2025 【PDF】

85. Yueheng Li, Guangming Xie, Zongqing Lu. Revisiting Cooperative Off-Policy Multi-Agent Reinforcement Learning in Proceedings of Forty-Second International Conference on Machine Learning, Vancouver, Canada, 2025 【PDF】

86. Ye Wang, Sipeng Zheng, Bin Cao, Qianshan Wei, Weishuai Zeng, Qin Jin, Zongqing Lu. Scaling Large Motion Models with Million-Level Human Motions in Proceedings of Forty-Second International Conference on Machine Learning, Vancouver, Canada, 2025 【PDF】

87. Zehong Ma, Shiliang Zhang, Longhui Wei, Qi Tian. Efficient Multi-modal Long Context Learning for Training-free Adaptation in Proceedings of Fourty-Third International Conference on Machine Learning, Seoul, South Korea, 2025 【PDF】

88. Zixuan Hu, Yichun Hu, Xiaotong Li, Shixiang Tang, Ling-Yu Duan. Beyond Entropy: Region Confidence Proxy for Wild Test-Time Adaptation in Proceedings of International Conference on Machine Learning, Vancouver, British Columbia, Canada, 2025 【PDF】

89. Yongqian Peng, Yuxi Ma, Mengmeng Wang, Yuxuan Wang, Yizhou Wang, Chi Zhang, Yixin Zhu, Zilong Zheng. Probing and Inducing Combinational Creativity in Vision-Language Models in Proceedings of the 47th Annual Meeting of the Cognitive Science Society, San Francisco, CA, USA, 2025 【PDF】

90. Wenye Lin, Jonathan Roberts, Yunhan Yang, Samuel Albanie, Zongqing Lu, Kai Han. Beyond Outcomes: Transparent Assessment of LLM Reasoning in Games in Proceedings of The 63rd Annual Meeting of the Association for Computational Linguistics, Vienna, Austria, 2025 【PDF】

91. Zecheng Hao, Qichao Ma, Kang Chen, Yi Zhang, Zhaofei Yu, Tiejun Huang. Faster and Stronger: When ANN-SNN Conversion Meets Parallel Spiking Calculation in Proceedings of the International Conference on Machine Learning, Vancouver, Canada, Vol.267, pp.22103-22115, 2025 【PDF】

92. Dong Xiao, Guangyao Chen, Peixi Peng, Yangru Huang, Yifan Zhao, Yongxing Dai,Yonghong Tian. When Every Millisecond Counts: Real-Time Anomaly Detection via theMultimodal Asynchronous Hybrid Network in Proceedings of the International Conference on Machine Learning, Vancouver,Canada, pp.1-14, 2025 【PDF】

93. Song Xia, Yi Yu, Wenhan Yang, Meiwen Ding, Zhuo Chen, Ling-Yu Duan, Alex C Kot, Xudong Jiang. Theoretical Insights in Model Inversion Robustness and Conditional Entropy Maximization for Collaborative Inference Systems in Proceedings of IEEE / CVF Computer Vision and Pattern Recognition Conference, Nashville, Tennessee, USA, 2025 【PDF】

94. Dong Feng, Lingyu Duan. Video Summarization Algorithm Based on Multimodal Feature Fusion in Proceedings of IEEE International Conference on Image Processing and Computer Applications, Shenyang, China, 2025 【PDF】

95. Dongkai Wang, Jiang Duan, Liangjian Wen, Shiyu Xuan, Hao Chen, and Shiliang Zhang. Generalizable Object Keypoint Localization from Generative Priors in Proceedings of IEEE/CVF Computer Vision and Pattern Recognition Conference, Nashville, USA, 2025 【PDF】

96. Ruihan Xu, Haokui Zhang, Yaowei Wang, Wei Zeng, Shiliang Zhang. NN-Former: Rethinking Graph Structure for Neural Architecture Representation in Proceedings of IEEE/CVF Computer Vision and Pattern Recognition Conference, Nashville, USA, 2025 【PDF】

97. Dianze Li, Jianing Li, Xu Liu, Xiaopeng Fan, Yonghong Tian. Asynchronous Collaborative Graph Representation for Frames and Events in Proceedings of the Computer Vision and Pattern Recognition Conference, Nashville, USA, pp.1655-1666, 2025 【PDF】

98. Xiao Wang, Yu Jin, Wentao Wu, Wei Zhang, Lin Zhu, Bo Jiang, Yonghong Tian. Object Detection using Event Camera: A MoE Heat Conduction based Detector and A New Benchmark Dataset in Proceedings of the Computer Vision and Pattern Recognition Conference, Nashville, USA, pp.29321-29330, 2025 【PDF】

99. Zhipeng Huang, Wangbo Yu, Xinhua Cheng, ChengShu Zhao, Yunyang Ge, Mingyi Guo, Li Yuan, Yonghong Tian. RoomPainter: View-integrated Diffusion for Consistent Indoor Scene Texturing in Proceedings of the Computer Vision and Pattern Recognition Conference, Nashville, USA, pp.574-584, 2025 【PDF】

100. Haoran Xu, Peixi Peng, Guang Tan, Yiqian Chang, Luntong Li, Yonghong Tian. VLMs-guided Representation Distillation for Efficient Vision-based Reinforcement Learning in Proceedings of the Computer Vision and Pattern Recognition Conference, Nashville, USA, pp.29534-29544, 2025 【PDF】

101. Hang Ye, Xiaoxuan Ma, Hai Ci, Wentao Zhu, Yizhou Wang. Free-form Generation Enhances Challenging Clothed Human Modeling in Proceedings of The IEEE/CVF Computer Vision and Pattern Recognition Conference, Nashville, TN, USA, 2025 【PDF】

102. Jinlu Zhang, Yixin Chen, Zan Wang, Jie Yang, Yizhou Wang, Siyuan Huang. InteractAnything: Zero-shot Human Object Interaction Synthesis via LLM Feedback and Object Affordance Parsing in Proceedings of The IEEE/CVF Computer Vision and Pattern Recognition Conference, Nashville, TN, USA, 2025 【PDF】

103. Chi Su , Xiaoxuan Ma , Jiajun Su , Yizhou Wang. SAT-HMR: Real-Time Multi-Person 3D Mesh Estimation via Scale-Adaptive Tokens in Proceedings of The IEEE/CVF Computer Vision and Pattern Recognition Conference, Nashville, TN, USA, 2025 【PDF】

104. Kang Chen, Jiyuan Zhang, Zecheng Hao, Yajing Zheng, Tiejun Huang and Zhaofei Yu. USP-Gaussian: Unifying Spike-based Image Reconstruction, Pose Correctionand Gaussian Splatting in Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, Nashville, USA, pp.16609-16618, 2025 【PDF】

105. Wenjing Han, Yueming Wu, Xinwei Sun, Lingjing Hu, Yizhou Wang. A Differential Inclusion Approach for Learning Heterogeneous Sparsity in Neuroimaging Analysis in Proceedings of The 28th International Conference on Artificial Intelligence and Statistics, Mai Khao, Thailand, 2025 【PDF】

106. Xiaopeng Yu, Wanpeng Zhang, Zongqing Lu. LLM-Based Explicit Models of Opponents for Multi-Agent Games in Proceedings of Annual Conference of the North American Chapter of the Association for Computational Linguistics, New Mexico, USA, 2025 【PDF】

107. Sha Guo, Jing Chen, Zixuan Hu, Zhuo Chen, Wenhan Yang, Yu Lin, Xing Jiang, LINGYU DUAN. Which Tasks Should Be Compressed Together? A Causal Discovery Approach for Efficient Multi-Task Representation Compression in Proceedings of International Conference on Learning Representations, Singapore, 2025 【PDF】

108. Yuanfei Wang, Xiaojie Zhang, Ruihai Wu, Yu Li, Yan Shen, Mingdong Wu, Zhaofeng He, Yizhou Wang, Hao Dong. AdaManip: Adaptive Articulated Object Manipulation Environments and Policy Learning in Proceedings of The Thirteenth International Conference on Learning Representations, Singapore, 2025 【PDF】

109. Haoru Wang, Wentao Zhu, Luyi Miao, Yishu Xu, Feng Gao, Qi Tian, Yizhou Wang. Aligning Human Motion Generation with Human Perceptions in Proceedings of The Thirteenth International Conference on Learning Representations, Singapore, 2025 【PDF】

110. Jiafei Lyu, Mengbei Yan, Zhongjian Qiao, Runze Liu, Xiaoteng Ma, Deheng Ye, Jing-Wen Yang, Zongqing Lu, Xiu Li. Cross-Domain Offline Policy Adaptation with Optimal Transport and Dataset Constraint in Proceedings of The Thirteenth International Conference on Learning Representations, Montréal, Canada, 2025 【PDF】

111. Haoqi Yuan, Bohan Zhou, Yuhui Fu, Zongqing Lu. Cross-Embodiment Dexterous Grasping with Reinforcement Learning in Proceedings of The Thirteenth International Conference on Learning Representations, Montréal, Canada, 2025 【PDF】

112. Haobin Jiang, Jiangxing Wang, Zongqing Lu. Discrete Latent Plans via Semantic Skill Abstractions in Proceedings of The Thirteenth International Conference on Learning Representations, Montréal, Canada, 2025 【PDF】

113. Ziye Huang, Haoqi Yuan, Yuhui Fu, Zongqing Lu. Efficient Residual Learning with Mixture-of-Experts for Universal Dexterous Grasping in Proceedings of The Thirteenth International Conference on Learning Representations, Montréal, Canada, 2025 【PDF】

114. Wanpeng Zhang, Zilong Xie, Yicheng Feng, Yijiang Li, Xingrun Xing, Sipeng Zheng, Zongqing Lu. From Pixels to Tokens: Byte-Pair Encoding on Quantized Visual Modalities in Proceedings of The Thirteenth International Conference on Learning Representations, Montréal, Canada, 2025 【PDF】

115. Mingzhou Liu, Ching-Wen Lee, Xinwei Sun, Xueqing Yu, Yu Qiao, Yizhou Wang. Learning Causal Alignment for Reliable Disease Diagnosis in Proceedings of The Thirteenth International Conference on Learning Representations, Singapore, 2025 【PDF】

116. Hao Luo, Zongqing Lu. Learning Video-Conditioned Policy on Unlabelled Data with Joint Embedding Predictive Transformer in Proceedings of The Thirteenth International Conference on Learning Representations, Montréal, Canada, 2025 【PDF】

117. Junpeng Yue, Xinrun Xu, B?rje F. Karlsson, Zongqing Lu. MLLM as Retriever: Interactively Learning Multimodal Retrieval for Embodied Agents in Proceedings of The Thirteenth International Conference on Learning Representations, Montréal, Canada, 2025 【PDF】

118. Yiding Wang, Yuxuan Chen, Fangwei Zhong, Long Ma, Yizhou Wang. Simulating Human-like Daily Activities with Desire-driven Autonomy in Proceedings of The Thirteenth International Conference on Learning Representations, Singapore, 2025 【PDF】

119. Jiangxing Wang, Zongqing Lu. Watch Less, Do More: Implicit Skill Discovery for Video-Conditioned Policy in Proceedings of The Thirteenth International Conference on Learning Representations, Montréal, Canada, 2025 【PDF】

120. Shaokang Wang, Guoqing Xiang, Wenzhao Li, Mingyuan Yang, Fan Yang, Shanghang Zhang, Xiaodong Xie, Huizhu Jia. Three-Stage Progressive Pre-Analysis Framework for VMAF Controllable Image Coding in Proceedings of the Data Compression Conference, Snowbird, USA, pp.404-404, 2025 【PDF】

121. Siwen Wang, Churan Wang, Fei Gao, Lixian Su, Fandong Zhang, Yizhou Wang, Yizhou Yu. Autoregressive Sequence Modeling for 3D Medical Image Representation in Proceedings of The 39th Annual AAAI Conference on Artificial Intelligence, Philadelphia, PA, USA, 2025 【PDF】

122. Haoyu Wang, Zhilu Zhang, Donglin Di, Shiliang Zhang, Wangmeng Zuo. MV-VTON: Multi-View Virtual Try-On with Diffusion Models in Proceedings of The 39th Annual AAAI Conference on Artificial Intelligence, Philadelphia, Pennsylvania, USA, 2025 【PDF】

123. Chaoran Feng, Wangbo Yu, Xinhua Cheng, Zhenyu Tang, Junwu Zhang, Li Yuan, Yonghong Tian. AE-NeRF: Augmenting Event-Based Neural Radiance for Non-ideal Conditions and Larger Scenes in Proceedings of the AAAI Conference on Artificial Intelligence, Philadelphia, USA, pp.2924-2932, 2025 【PDF】

124. Yueru Jia, Yuhui Yuan, Aosong Cheng, Chuke Wang, Ji Li, Huizhu Jia, Shanghang Zhang. DesignEdit: Unify Spatial-Aware Image Editing via Training-free Inpainting with a Multi-Layered Latent Diffusion Framework in Proceedings of the AAAI Conference on Artificial Intelligence, Philadelphia, USA, Vol.39, No.4, pp.3958-3966, 2025 【PDF】

125. Kang Chen, Yajing Zheng, Tiejun Huang and Zhaofei Yu. Rethinking High-speed Image Reconstruction Framework with Spike Camera in Proceedings of the AAAI Conference on Artificial Intelligence, Philadelphia, USA, Vol.39, No.2, pp.2097-2104, 2025 【PDF】

126. Zhenxian Liu, Peixi Peng, Yonghong Tian. Visual Reinforcement Learning with Residual Action in Proceedings of the AAAI Conference on Artificial Intelligence, Philadelphia, USA, pp.19050-19058, 2025 【PDF】

127. Zihan Huang, Wei Fang, Tong Bu, Peng Xue, Zecheng Hao, Wenxuan Liu, Yuanhong Tang, Zhaofei Yu, Tiejun Huang. Differential Coding for Training-Free ANN-to-SNN Conversion in Proceedings of the Forty-second International Conference on Machine Learning, Vancouver, Canada, Vol.267, pp.25235-25264, 2025 【PDF】

128. Lusen Zhao, Zihan Huang, Jianhao Ding, Zhaofei Yu. TTFSFormer: A TTFS-based Lossless Conversion of Spiking Transformer in Proceedings of the Forty-second International Conference on Machine Learning, Vancouver, Canada, 2025 【PDF】

129. Sixiang Chen, Jiaming Liu, Siyuan Qian, Han Jiang, Lily Li, Renrui Zhang, Zhuoyang Liu, Chenyang Gu, Chengkai Hou, Pengwei Wang, Zhongyuan Wang, Shanghang Zhang. AC-DiT: Adaptive Coordination Diffusion Transformer for Mobile Manipulation in Proceedings of Advances in Neural Information Processing Systems, San Diego, USA, 2025 【PDF】

130. Qizhe Zhang, Mengzhen Liu, Lichen Li, Ming Lu, Yuan Zhang, Junwen Pan, Qi She, Shanghang Zhang. Beyond Attention or Similarity: Maximizing Conditional Diversity for Token Pruning in MLLMs in Proceedings of Advances in Neural Information Processing Systems, San Diego, USA, 2025 【PDF】

131. Hao Chen, Jiaming Liu, Chenyang Gu, Zhuoyang Liu, Renrui Zhang, Xiaoqi Li, Xiao He, Yandong Guo, Chi-Wing Fu, Shanghang Zhang, Pheng-Ann Heng. Fast-in-Slow: A Dual-System Foundation Model Unifying Fast Manipulation within Slow Reasoning in Proceedings of Advances in Neural Information Processing Systems, San Diego, USA, 2025 【PDF】

132. Gaole Dai, Chenghao Zhou, Yu Zhou, Rongyu Zhang, Yuan Zhang, Chengkai Hou, Tiejun Huang, Jianxu Chen, Shanghang Zhang. Orochi: Versatile Biomedical Image Processor, Advances in Neural Information Processing Systems in Proceedings of Advances in Neural Information Processing Systems, San Diego, USA, 2025 【PDF】

133. Huajie Tan, Yuheng Ji, Xiaoshuai Hao, Xiansheng Chen, Pengwei Wang, Zhongyuan Wang, Shanghang Zhang. Reason-RFT: Reinforcement Fine-Tuning for Visual Reasoning of Vision Language Models in Proceedings of Advances in Neural Information Processing Systems, San Diego, USA, 2025 【PDF】

134. Enshen Zhou, Jingkun An, Cheng Chi, Yi Han, Shanyu Rong, Chi Zhang, Pengwei Wang, Zhongyuan Wang, Tiejun Huang, Lu Sheng, Shanghang Zhang. RoboRefer: Towards Spatial Referring with Reasoning in Vision-Language Models for Robotics in Proceedings of Advances in Neural Information Processing Systems, San Diego, USA, 2025 【PDF】

135. Wanxin Tian, Shijie Zhang, Kevin Zhang, Xiaowei Chi, Chunkai Fan, Junyu Lu, Yulin Luo, Qiang Zhou, Yiming Zhao, Ning Liu, Siyu Lin, Zhiyuan Qin, Xiaozhu Ju, Shanghang Zhang, Jian Tang. SEEA-R1: Tree-Structured Reinforcement Fine-Tuning for Self-Evolving Embodied Agents in Proceedings of Advances in Neural Information Processing Systems, San Diego, USA, 2025 【PDF】

136. Zhe Li, Xiang Bai, Jieyu Zhang, Zhuangzhe Wu, Che Xu, Ying Li, Chengkai Hou, Shanghang Zhang. URDF-Anything: Constructing Articulated Objects with 3D Multimodal Language Model in Proceedings of Advances in Neural Information Processing Systems, San Diego, USA, 2025 【PDF】

137. Shuchen Weng, Haojie Zheng, Zheng Chang, Si Li, Boxin Shi, Xinlong Wang. Audio-sync video generation with multi-stream temporal control in Proceedings of Conference on Neural Information Processing Systems, San Diego, USA, 2025 【PDF】

138. Zhaoyu Chen, Haijing Guo, Kaixun Jiang, Jiyuan Fu, Xinyu Zhou, Dingkang Yang, Hao Tang, Bo Li, Wenqiang Zhang. Boosting Adversarial Transferability with Spatial Adversarial Alignment in Proceedings of Conference on Neural Information Processing Systems, San Diego, USA, 2025 【PDF】

139. Boyu Li, Peiqi Duan, Zhaojun Huang, Xinyu Zhou, Yifei Xia, Boxin Shi. Dense metric depth estimation via event-based differential focus volume prompting in Proceedings of Conference on Neural Information Processing Systems, San Diego, USA, 2025 【PDF】

140. Kaixun Jiang, Zhaoyu Chen, HaiJing Guo, Jinglun Li, Jiyuan Fu, Pinxue Guo, Hao Tang, Bo Li, Wenqiang Zhang. Enhancing Diffusion-based Unrestricted Adversarial Attacks via Adversary Preferences Alignment in Proceedings of Conference on Neural Information Processing Systems, San Diego, USA, 2025 【PDF】

141. Yuxuan Wang, Ming Yang, Weishuai Zeng, Yu Zhang, Xinrun Xu, Haobin Jiang, Ziluo Ding, Zongqing Lu. From Experts to a Generalist: Toward General Whole-Body Control for Humanoid Robots in Proceedings of Conference on Neural Information Processing Systems, Montréal, Canada, 2025 【PDF】

142. Wentao Wang,?Hang Ye,?Fangzhou Hong,?Xue Yang,?Jianfu Zhang,?Yizhou Wang,?Ziwei Liu,?Liang Pan. GeneMAN: Generalizable Single-Image 3D Human Reconstruction from Multi-Source Human Data in Proceedings of Conference on Neural Information Processing Systems, San Diego, CA, USA, 2025 【PDF】

143. Bohan Zhou, Yi Zhan, Zhongbin Zhang, Zongqing Lu. MEgoHand: Multi-Modal Egocentric Hand-Object Interaction Motion Generation in Proceedings of Conference on Neural Information Processing Systems, Montréal, Canada, 2025 【PDF】

144. Hao Luo, Zihao Yue, Wanpeng Zhang, Yicheng Feng, Sipeng Zheng, Deheng Ye, Zongqing Lu. OpenMMEgo: Enhancing Egocentric Understanding for LMMs with Open Weights and Data in Proceedings of Conference on Neural Information Processing Systems, Montréal, Canada, 2025 【PDF】

145. Yifei Xia, Shuchen Weng, Siqi Yang, Jingqi Liu, Chengxuan Zhu, Minggui Teng, Zijian Jia, Han Jiang, Boxin Shi. PanoWan: Lifting diffusion video generation models to 360° with latitude/longitude-aware mechanisms in Proceedings of Conference on Neural Information Processing Systems, San Diego, USA, 2025 【PDF】

146. Xiaopeng Yu, Kefan Su, Zongqing Lu. Planning with Quantized Opponent Models in Proceedings of Conference on Neural Information Processing Systems, Montréal, Canada, 2025 【PDF】

147. Long Ma, Fangwei Zhong, Yizhou Wang. Reinforced Context Order Recovery for Adaptive Reasoning and Planning in Proceedings of Conference on Neural Information Processing Systems, San Diego, CA, USA, 2025 【PDF】

148. Fanhu Zeng, Haiyang Guo, Fei Zhu, Li Shen, Hao Tang. RobustMerge: Parameter-Efficient Model Merging for MLLMs with Direction Robustness in Proceedings of Conference on Neural Information Processing Systems, San Diego, USA, 2025 【PDF】

149. Jing Hao, Yuxuan Fan, Yanpeng Sun, Kaixin Guo, Lizhuo Lin, Jinrong Yang, Qi Yong H. Ai, Lun M. Wong, Hao Tang, Kuo Feng Hung. Towards Better Dental AI: A Multimodal Benchmark and Instruction Dataset for Panoramic X-ray Analysis in Proceedings of Conference on Neural Information Processing Systems, San Diego, USA, 2025 【PDF】

150. Hanyue Lou, Jinxiu Liang, Minggui Teng, Yi Wang, and Boxin Shi. V2V: Scaling event-based vision through efficient video-to-voxel simulation in Proceedings of Conference on Neural Information Processing Systems, San Diego, USA, 2025 【PDF】

151. Zhenkun Zhu, Ruiqin Xiong, Jixu Xie, Yuanlin Wang, Xinfeng Zhang, Tiejun Huang. High Dynamic Range Imaging with Time-Encoding Spike Camera in Proceedings of Neural Information Processing Systems, San Diego, USA, 2025 【PDF】

152. Peng Xue, Wei Fang, Zhengyu Ma, Zihan Huang, Zhaokun Zhou, Yonghong Tian, Timothée Masquelier, Huihui Zhou. Muliplication-Free Parallelizable Spiking Neurons with Efficient Spatio-Temporal Dynamics in Proceedings of the Conference on Neural Information Processing Systems, San Diego, USA, pp.1-26, 2025 【PDF】

153. Qinghong Ye, Yiqian Chang, Jianing Li, Haoran Xu, Xuan Wang, Wei Zhang, Yonghong Tian, Peixi Peng. Spike4DGS: Towards High-Speed Dynamic Scene Reconstruction with 4D Gaussian Splatting via a Spike Camera Array in Proceedings of the Conference on Neural Information Processing Systems, San Diego, USA, pp.1-21, 2025 【PDF】

154. Liwei Huang, Liwei Huang , Zhengyu Ma, Liutao Yu, Huihui Zhou, Yonghong Tian. Time-Evolving Dynamical System for Learning Latent Representations of Mouse Visual Neural Activity in Proceedings of the Conference on Neural Information Processing Systems, San Diego, USA, pp.1-29, 2025 【PDF】

155. Tong Bu, Xinyu Shi, Zhaofei Yu. Activity Pruning for Efficient Spiking Neural Networks in Proceedings of the Neural Information Processing Systems, San Diego, USA, 2025 【PDF】

156. Zijie Xu,?Tong Bu,?Zecheng Hao,?Jianhao Ding,?Zhaofei Yu. Proxy Target: Bridging the Gap Between Discrete Spiking Neural Networks and Continuous Control in Proceedings of the Neural Information Processing Systems, San Diego, USA, 2025 【PDF】

157. Zehong Ma, Longhui Wei, Feng Wang, Shiliang Zhang, Qi Tian. MagCache: Fast Video Generation with Magnitude-Aware Cache in Proceedings of The Thirty-Ninth Annual Conference on Neural Information Processing Systems, San Diego, USA, 2025 【PDF】

158. Wenpeng Cui, Xinwei Zheng, Hongming Zhang, Wei Zeng. Semantic Maintained Video Compression by Background Blurring in Surveillance Scenarios in Proceedings of 13th International Conference on Image and Graphics, Xuzhou, China, Vol.16161, pp.469-478, 2025 【PDF】

159. Yihua Shao, Haojin He, Sijie Li, Siyu Chen, Xinwei Long, Fanhu Zeng, Yuxuan Fan, Muyang Zhang, Ziyang Yan, Ao Ma, Xiaochen Wang, Hao Tang, Yan Wang, Shuyan Li. EventVAD: Training-free Event-aware Video Anomaly Detection in Proceedings of ACM International Conference on Multimedia, Dublin, Ireland, 2025 【PDF】

160. Jiazheng Liu, Sipeng Zheng, B?rje F. Karlsson, Zongqing Lu. Taking Notes Brings Focus? Towards Multi-Turn Multimodal Dialogue Learning in Proceedings of Conference on Empirical Methods in Natural Language Processing, Suzhou, China, 2025 【PDF】

161. Xinzi Cao, Ke Chen, Feidiao Yang, Xiawu Zheng, Yonghong Tian, Yutong Lu. AllGCD: Leveraging All Unlabeled Data for Generalized Category Discovery in Poceedings of the IEEE/CVF International Conference on Computer Vision, Hawaii, USA, pp.3293-3300, 2025 【PDF】

162. Wangbo Yu, Chaoran Feng, Jiye Tang, Jiashu Yang, Zhenyu Tang, Xu Jia, Yuchao Yang, Li Yuan, Yonghong Tian. EvaGaussians: Event Stream Assisted Gaussian Splatting from Blurry Images in Poceedings of the IEEE/CVF International Conference on Computer Vision, Hawaii, USA, pp.24780-24790, 2025 【PDF】

163. Yuhui Zeng, Haoxiang Wu, Wenjie Nie, Guangyao Chen, Xiawu Zheng, Yunhang Shen, Jun Peng, Yonghong Tian, Rongrong Ji. From Objects to Events: Unlocking Complex Visual Understanding in Object Detectors via LLM-guided Symbolic Reasoning in Poceedings of the IEEE/CVF International Conference on Computer Vision, Hawaii, USA, pp.24380-24391, 2025 【PDF】

164. Qinhua Xie, Hao Tang. TTTFusion: A Test-Time Training-Based Strategy for Multimodal Medical Image Fusion in Surgical Robots in Proceedings of International Conference on Intelligent Robots and Systems, Hangzhou, China, 2025 【PDF】

165. Junwei Zhao, Qianchun Luo, Shiliang Zhang, Shen Gao, Jie Wu. HDCFN: Haze Distribution-aware Cross-modal Fusion Network for Infrared-guided Dense Haze Removal in UAVs in Proceedings of ACM International Conference on Multimedia, Dublin, Ireland, 2025 【PDF】

166. Jin Han, Yixin Yang, Zhan Zhan, Boxin Shi, Imari Sato. EDeF-Net: Spatio-temporal association network for flicker removal in event streams in Proceedings of ACM Multimedia Conference, Dublin, Ireland, 2025 【PDF】

167. Haocheng Tang, Ruoke Yan, Xinhui Yin, Qi Zhang, Xinfeng Zhang, Siwei Ma, Wen Gao, Chuanmin Jia. HGC-Avatar: Hierarchical Gaussian Compression for Streamable Dynamic 3D Avatars in Proceedings of ACM Multimedia Conference 2025, Dublin, Ireland, 2025 【PDF】

168. Bohan Zhou, Zhongbin Zhang, Jiangxing Wang, Zongqing Lu. NOLO: Navigate Only Look Once in Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems, Las Vegas, USA, 2025 【PDF】

169. Zixuan Hu, Dongxiao Li, Xinzhu Ma, Shixiang Tang, Xiaotong Li, Wenhan Yang, Ling-Yu Duan. Adaptive Dual Uncertainty Optimization: Boosting Monocular 3D Object Detection under Test-Time Shifts in Proceedings of International Conference on Computer Vision, Honolulu, Hawaii, USA, 2025 【PDF】

170. Tianyi Xu, Fan Zhang, Boxin Shi, Tianfan Xue, and Yujin Wang. AdaptiveAE: An adaptive exposure strategy for HDR capturing in dynamic scenes in Proceedings of International Conference on Computer Vision, Honolulu, Hawaii, USA, 2025 【PDF】

171. Ruofei Wang, Peiqi Duan, Boxin Shi, Renjie Wan. Asynchronous event error-minimizing noise for safeguarding event dataset in Proceedings of International Conference on Computer Vision, Honolulu, Hawaii, USA, 2025 【PDF】

172. Chengxuan Zhu, Qingnan Fan, Qi Zhang, Jinwei Chen, Huaqi Zhang, Chao Xu, Boxin Shi. BokehDiff: Neural lens blur with one-step diffusion in Proceedings of International Conference on Computer Vision, Honolulu, Hawaii, USA, 2025 【PDF】

173. Jiangran Lyu, Ziming Li, Xuesong Shi, Chaoyi Xu, Yizhou Wang, He Wang. DyWA: Dynamics-adaptive World Action Model for Generalizable Non-prehensile Manipulation in Proceedings of International Conference on Computer Vision, Honolulu, HI, USA, 2025 【PDF】

174. Wentao Zhu, Zhining Zhang, Yuwei Ren, Yin Huang, Hao Xu, Yizhou Wang. Embodied Representation Alignment with Mirror Neurons in Proceedings of International Conference on Computer Vision, Honolulu, HI, USA, 2025 【PDF】

175. Xinyu Zhou, Peiqi Duan, Yeliduosi Xiaokaiti, Chao Xu, Boxin Shi. Event-based visual vibrometry in Proceedings of International Conference on Computer Vision, Honolulu, Hawaii, USA, 2025 【PDF】

176. Yixin Yang, Jiawei Zhang, Yang Zhang, Yunxuan Wei, Dongqing Zou, Jimmy S. Ren, Boxin Shi. Event-guided HDR reconstruction with diffusion priors in Proceedings of International Conference on Computer Vision, Honolulu, Hawaii, USA, 2025 【PDF】

177. Jinxiu Liang, Bohan Yu, Siqi Yang, Haotian Zhuang, Jieji Ren, Peiqi Duan, Boxin Shi. EventUPS: Uncalibrated photometric stereo using an event camera in Proceedings of International Conference on Computer Vision, Honolulu, Hawaii, USA, 2025 【PDF】

178. Tong Wei, Yijun Yang, Junliang Xing, Yuanchun Shi, Zongqing Lu, Deheng Ye. GTR: Guided Thought Reinforcement Prevents Thought Collapse in RL-based VLM Agent Training in Proceedings of International Conference on Computer Vision, Hawaii, USA, 2025 【PDF】

179. Yuanlin Wang, Ruiqin Xiong, Rui Zhao, Jin Wang, Xiaopeng Fan, Tiejun Huang. ISP2HRNet: Learning to Reconstruct High Resolution Image from Irregularly Sampled Pixels via Hierarchical Gradient Learning in Proceedings of International Conference on Computer Vision, Hawaii, USA, 2025 【PDF】

180. Bin Xie, Hao Tang, Bin Duan, Dawen Cai, Yan Yan, Gady Agam. MaskSAM: Towards Auto-prompt SAM with Mask Classification for Medical Image Segmentation in Proceedings of International Conference on Computer Vision, Honolulu, USA, 2025 【PDF】

181. Bin Cao, Sipeng Zheng, Ye Wang, Lujie Xia, Qianshan Wei, Qin Jin, Jing Liu, Zongqing Lu. MotionCtrl: A Real-Time Controllable Vision-Language-Motion Model in Proceedings of International Conference on Computer Vision, Hawaii, USA, 2025 【PDF】

182. Kailong Zhang, Youwei Lyu, Heng Guo, Si Li, Zhanyu Ma, Boxin Shi. PolarAnything: Diffusion-based polarimetric image synthesis in Proceedings of International Conference on Computer Vision, Honolulu, Hawaii, USA, 2025 【PDF】

183. Chu Zhou, Yixin Yang, Junda Liao, Heng Guo, Boxin Shi, Imari Sato. Polarimetric neural field via unified complex-valued wave representation in Proceedings of International Conference on Computer Vision, Honolulu, Hawaii, USA, 2025 【PDF】

184. Yufei Han, Bowen Tie, Heng Guo, Youwei Lyu, Si Li, Boxin Shi, Yunpeng Jia, Zhanyu Ma. PolGS: Polarimetric Gaussian splatting for fast reflective surface reconstruction in Proceedings of International Conference on Computer Vision, Honolulu, Hawaii, USA, 2025 【PDF】

185. Siqi Yang, Jinxiu Liang, Zhaojun Huang, Yeliduosi Xiaokaiti, Yakun Chang, Zhaofei Yu, Boxin Shi. SpikeDiff: Zero-shot high-quality video reconstruction from chromatic spike camera and sub-millisecond spike streams in Proceedings of International Conference on Computer Vision, Honolulu, Hawaii, USA, 2025 【PDF】

186. Wanpeng Zhang, Yicheng Feng, Hao Luo, Yijiang Li, Zihao Yue, Sipeng Zheng, Zongqing Lu. Unified Multimodal Understanding via Byte-Pair Visual Encoding in Proceedings of International Conference on Computer Vision, Hawaii, USA, 2025 【PDF】

187. Zhanzhou Feng, Qingpei Guo, Xinyu Xiao, Ruihan Xu, Ming Yang, Shiliang Zhang. Unified Video Generation via Next-Set Prediction in Continuous Domain in Proceedings of International Conference on Computer Vision, Honolulu, Hawai'i, USA, 2025 【PDF】

188. Fangwei Zhong, Kui Wu, Churan Wang, Hao Chen, Hai Ci, Zhoujun Li, Yizhou Wang. UnrealZoo: Enriching Photo-realistic Virtual Worlds for Embodied AI in Proceedings of International Conference on Computer Vision, Honolulu, HI, USA, 2025 【PDF】

189. Yicheng Feng, Yijiang Li, Wanpeng Zhang, Sipeng Zheng, Hao Luo, Zihao Yue, Zongqing Lu. VideoOrion: Tokenizing Object Dynamics in Videos in Proceedings of International Conference on Computer Vision, Hawaii, USA, 2025 【PDF】

190. Minggui Teng, Boyu Li, Yixin Yang, Chu Zhou, Yan Chen, Jimmy S. Ren, Boxin Shi. Monochromatic event guided image deblurring with event-triggering-aware decomposition in Proceedings of International Conference on Computer Vision Workshops, Honolulu, Hawaii, USA, 2025 【PDF】

191. Linye Wei, Jiajun Tang, Fan Fei, Boxin Shi, Runsheng Wang, Meng Li. No redundancy,no stall: Lightweight streaming 3D Gaussian splatting for real-time rendering in Proceedings of International Conference on Computer-Aided Design, Munich, Germany, 2025 【PDF】

192. Haoran Xu, Saining Zhang, Peishuo Li, Baijun Ye, Xiaoxue Chen, Huan-ang Gao, Jv Zheng, Xiaowei Song, Ziqiao Peng, Run Miao, Jinrang Jia, Yifeng Shi, Guangqi Yi, Hang Zhao, Hao Tang, Hongyang Li, Kaicheng Yu, Hao Zhao. CRUISE: Cooperative Reconstruction and Editing in V2X Scenarios using Gaussian Splatting in Proceedings of International Conference on Intelligent Robots and Systems, Hangzhou, China, 2025 【PDF】

193. Yan Zhong, Xinping Zhao, Li Zhang, Xinyuan Song, Tingting Jiang. Adaptive Prompt Learning for Blind Image Quality Assessment with Multi-modal Mixed-datasets Training in Proceedings of the ACM International Conference on Multimedia, Dublin, Ireland, pp.7453-7462, 2025 【PDF】

194. Dongyang Ma, Zhengyu Ma, Wei Zhang, Yonghong Tian. DSF-Net: Dynamic Sparse Fusion of Event-RGB via Spike-Triggered Attention for High-Speed Detection in Proceedings of the ACM International Conference on Multimedia, Dublin, Ireland, pp.9006-9015, 2025 【PDF】

195. Chaoran Feng, Zhenyu Tang, Wangbo Yu, Yatian Pang, Yian Zhao, Jianbin Zhao, Li Yuan, Yonghong Tian. E-4DGS: High-Fidelity Dynamic Reconstruction from the Multi-view Event Cameras in Proceedings of the ACM International Conference on Multimedia, Dublin, Ireland, pp.7356-7365, 2025 【PDF】

196. Quanmin Liang, Jinyi Lu, Qiang Li, Shuai Liu, Zhihao Zhao, Yinzheng Zhao, Wei Zhang, Kai Huang, Yonghong Tian. ESOD: Event-based Small Object Detection in Proceedings of the ACM International Conference on Multimedia, Dublin, Ireland, pp.518-527, 2025 【PDF】

197. Haiyang Zhou, Wangbo Yu, Jiawen Guan, Xinhua Cheng, Yonghong Tian, Li Yuan. HoloTime: Taming video diffusion models for panoramic 4D scene generation in Proceedings of the ACM International Conference on Multimedia, Dublin, Ireland, pp.9763-9772, 2025 【PDF】

198. Chengkai Hou, Yanjie Ze, Yankai Fu , Zeyu Gao, Songbo Hu, Yue Yu, Shanghang Zhang, Huazhe Xu. 4D Visual Pre-training for Robot Learning in Proceedings of the IEEE/CVF International Conference on Computer Vision, Hawaii, USA, 2025 【PDF】

199. Lening Wang, Wenzhao Zheng, Dalong Du, Yunpeng Zhang, Yilong Ren, Han Jiang, Zhiyong Cui, Haiyang Yu, Jie Zhou, Shanghang Zhang. Authentic 4D Driving Simulation with a Video Generation Model in Proceedings of the IEEE/CVF International Conference on Computer Vision, Hawaii, USA, 2025 【PDF】

200. Qizhe Zhang, Aosong Cheng, Ming Lu, Renrui Zhang, Zhiyong Zhuo, Jiajun Cao, Shaobo Guo, Qi She, Shanghang Zhang. Beyond Text-Visual Attention: Exploiting Visual Cues for Effective Token Pruning in VLMs in Proceedings of the IEEE/CVF International Conference on Computer Vision, Hawaii, USA, 2025 【PDF】

201. Xiaobao Wei, Qingpo Wuwu, Zhongyu Zhao, Zhuangzhe Wu, Nan Huang, Ming Lu, Ningning MA, Shanghang Zhang. EMD: Explicit Motion Modeling for High-Quality Street Gaussian Splatting open review in Proceedings of the IEEE/CVF International Conference on Computer Vision, Hawaii, USA, 2025 【PDF】

202. Yingbo Tang, Shuaike Zhang, Xiaoshuai Hao, Pengwei Wang, Jianlong Wu, Zhongyuan Wang, Shanghang Zhang. AffordGrasp: In-Context Affordance Reasoning for Open-Vocabulary Task-Oriented Grasping in Clutter in Proceedings of the IEEE/RSJ International Conference on Intelligent Robots and Systems, Hangzhou, China, 2025 【PDF】

203. Liang Heng, Xiaoqi Li, Shangqing Mao, Jiaming Liu, Ruolin Liu, Jingli Wei, Yu-Kai Wang, Jia Yueru, Chenyang Gu, Rui Zhao, Shanghang Zhang, Hao Dong. RwoR: Generating Robot Demonstrations from Human Hand Collection for Policy Learning without Robot IROS in Proceedings of the IEEE/RSJ International Conference onIntelligent Robots and Systems, Hangzhou, China, 2025 【PDF】

204. Bingchan Zhao, Xinyi Liu, Zhuocheng Yu, Tongchen Yang, Yifan Song, Mingyu Jin, Sujian Li, Yizhou Wang. Exploring Fine-Grained Human Motion Video Captioning in Proceedings of The 31st International Conference on Computational Linguistics, Abu Dhabi, UAE, 2025 【PDF】

205. Xinyu Hang, Zhimeng Huang, Chuanmin Jia, Siwei Ma. Adversarial Data Augmentation with Controlled Noise for Deep Image Compression in Proceedings of IEEE International Conference on Image Processing 2025 Workshop, Anchorage, USA, 2025 【PDF】

206. Changdi Yang, Zheng Zhan, Ci Zhang, Yifan Gong, Yize Li, Zichong Meng, Jun Liu, Xuan Shen, Hao Tang, Geng Yuan, Pu Zhao, Xue Lin, Yanzhi Wang. FairSMOE: Mitigating Multi-Attribute Fairness Problem with Sparse Mixture-of-Experts in Proceedings of International Joint Conference on Artificial Intelligence, Montreal, Canada, 2025 【PDF】

207. Yihua Shao, Minxi Yan, Yang Liu, Siyu Chen, Wenjie Chen, Xinwei Long, Ziyang Yan, Lei Li, Chenyu Zhang, Nicu Sebe, Hao Tang, Yan Wang, Hao Zhao, Mengzhu Wang, Jingcai Guo. In-Context Meta LoRA Generation in Proceedings of International Joint Conference on Artificial Intelligence, Montreal, Canada, 2025 【PDF】

208. Zihang Liu, Zhenyu Zhang, Hao Tang. Semantic-Guided Diffusion Model for Single-Step Image Super-Resolution in Proceedings of International Joint Conference on Artificial Intelligence, Montreal, Canada, 2025 【PDF】

209. Chuanmin Jia, Feng Ye, Siwei Ma, Wen Gao, Huifang Sun, Leonardo Chiariglione. Emerging Advances in Learned Video Compression: Models, Systems and Beyond in Proceedings of the Thirty-Fourth International Joint Conference on Artificial Intelligence, Montreal, Canada, pp.10490-10498, 2025 【PDF】

210. Xiaowei Chi, Chun-Kai Fan, Hengyuan Zhang, Xingqun Qi, Rongyu Zhang, Anthony Chen, Chi-Min Chan, Wei Xue, Qifeng Liu, Shanghang Zhang, Yike Guo. Empowering World Models with Reflection for Embodied Video Prediction in Proceedings of the International Conference on Machine Learning, Vancouver, Canada, 2025 【PDF】

211. Tianyu Chen, Haoyi Zhou, Ying Li, Hao Wang, Chonghan Gao, Rongye Shi, Shanghang Zhang, Jianxin Li. OmniArch: Building Foundation Model for Scientific Computing in Proceedings of the International Conference on Machine Learning, Vancouver, Canada, 2025 【PDF】

212. Qingpo Wuwu, Chonghan Gao, Tianyu Chen, Yihang Huang, Yuekai Zhang, Jianing Wang, Jianxin Li, Haoyi Zhou, Shanghang Zhang. PINNsAgent: Automated PDE Surrogation with Large Language Models in Proceedings of the International Conference on Machine Learning, Vancouver, Canada, 2025 【PDF】

213. Gaole Dai, Chun-Kai Fan, Yiming Tang, Zhi Zhang, Yuan Zhang, Yulu Gan, Qizhe Zhang, Cheng-Ching Tseng, Shanghang Zhang, Tiejun Huang. SAN: Hypothesizing Long-Term Synaptic Development and Neural Engram Mechanism in Scalable Model in Proceedings of the International Conference on Machine Learning, Vancouver, Canada, 2025 【PDF】

214. Yan Zhong, Chenxi Yang, Suyuan Zhao, Tingting Jiang. Semi-Supervised Blind Quality Assessment with Confidence-quantifiable Pseudo-label Learning for Authentic Images in Proceedings of the International Conference on Machine Learning, Vancouver, Canada, 2025 【PDF】

215. Yuan Zhang, Chun-Kai Fan, Junpeng Ma, Wenzhao Zheng, Tao Huang, Kuan Cheng, Denis A Gudovskiy, Tomoyuki Okuno, Yohei Nakata, Kurt Keutzer, Shanghang Zhang. SparseVLM: Visual Token Sparsification for Efficient Vision Language Models Inference in Proceedings of the International Conference on Machine Learning, Vancouver, Canada, 2025 【PDF】

216. Haofeng Wang, Yilin Guo, Zehao Li, Tong Yue, Feng Gao and Siwei Ma. RiverEcho: Real-Time Interactive Digital System for Ancient Yellow River Culture in Proceedings of 2025 IEEE International Conference on Multimedia and Expo Workshops, Nantes, France, pp.1-6, 2025 【PDF】

217. Yanchen Dong, Ruiqin Xiong, Xiaopeng Fan, Zhaofei Yu, Yonghong Tian, Tiejun Huang. Self-Supervised Learning for Color Spike Camera Reconstruction in Proceedings of Computer Vision and Pattern Recognition, Nashville, USA, 2025 【PDF】

218. Yuanlin Wang, Yiyang Zhang, Ruiqin Xiong, Jing Zhao, Jian Zhang, Xiaopeng Fan, Tiejun Huang. Spk2SRImgNet: Super-Resolve Dynamic Scene from Spike Stream via Motion Aligned Collaborative Filtering in Proceedings of Computer Vision and Pattern Recognition, Nashville, USA, 2025 【PDF】

219. Xiaoyi Liu, Hao Tang. DiffFNO: Diffusion Fourier Neural Operator in Proceedings of Conference on Computer Vision and Pattern Recognition, Nashville, USA, 2025 【PDF】

220. Fanhu Zeng, Hao Tang, Yihua Shao, Siyu Chen, Ling Shao, Yan Wang. MambaIC: State Space Models for High-Performance Learned Image Compression in Proceedings of Conference on Computer Vision and Pattern Recognition, Nashville, USA, 2025 【PDF】

221. Mingju Gao, Yike Pan, Huan-ang Gao, Zongzheng Zhang, Wenyi Li, Hao Dong, Hao Tang, Li Yi, Hao Zhao. PartRM: Modeling Part-Level Dynamics with Large Cross-State Reconstruction Model in Proceedings of Conference on Computer Vision and Pattern Recognition, Nashville, USA, 2025 【PDF】

222. Bohan Yu, Jinxiu Liang, Zhuofeng Wang, Bin Fan, Art Subpa-asa, Boxin Shi, Imari Sato. Active Hyperspectral Imaging Using an Event Camera in Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, Nashville TN, USA, 2025 【PDF】

223. Bohan Yu, Jin Han, Boxin Shi, Imari Sato. EventPSR: Surface normal and reflectance estimation from photometric stereo using an event camera in Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, Nashville TN, USA, 2025 【PDF】

224. Ziqi Cai, Shuchen Weng, Yifei Xia, Boxin Shi. PhyS-EdiT: Physics-aware semantic image editing with text description in Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, Nashville TN, USA, 2025 【PDF】

225. Shuangfan Zhou, Chu Zhou, Youwei Lyu, Heng Guo, Zhanyu Ma, Boxin Shi, Imari Sato. PIDSR: Complementary polarized image demosaicing and super-resolution in Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, Nashville TN, USA, 2025 【PDF】

226. Jiajun Tang, Fan Fei, Zhihao Li, Xiao Tang, Shiyong Liu, Youyu Chen, Binxiao Huang, Zhenyu Chen, Xiaofei Wu, Boxin Shi. SpecTRe-GS: Modeling highly specular surfaces with reflected nearby objects by tracing rays in 3D gaussian splatting in Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, Nashville TN, USA, 2025 【PDF】

227. Qiyao Gao, Peiqi Duan, Hanyue Lou, Minggui Teng, Ziqi Cai, Xu Chen, Boxin Shi. Unified reconstruction of static and dynamic scenes from events in Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, Nashville TN, USA, 2025 【PDF】

228. Shuchen Weng, Haojie Zheng, Peixuan Zhang, Yuchen Hong, Han Jiang, Si Li, Boxin Shi. VIRES: Video instance repainting via sketch and text guided generation in Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, Nashville TN, USA, 2025 【PDF】

229. Yanchen Zhao, Wenhong Duan, Jiaqi Zhang, Zhimeng Huang, Lin Li, Qi Wang, Siwei Ma. Lightweight Learning-Based In-Loop Filter for Real-Time Video Coding in Proceedings of IEEE International Conference on Multimedia and Expo, Nantes, France, pp.1-6, 2025 【PDF】

230. Yizong Wang, Mingjia Yang, Liming Pang, Dong Zhao, Siwei Ma, Wen Gao. LiVo: Bandwidth-Efficient Live Volumetric Video Streaming with Compact Capture and Encoding in Proceedings of IEEE International Conference on Multimedia and Expo, Nantes, France, pp.1-6, 2025 【PDF】

231. Qian Yin, Haopeng Lu, Mingjia Yang, Ruiqi Li, Yizong Wang, Lili Zhao, Sujia Wang, Xinfeng Zhang, Siwei Ma. LIVE-FIT: LED-based Immersive Virtual Environment with Fusion, Interaction, and Transmission in Proceedings of IEEE International Conference on Multimedia and Expo Workshops, Nantes, France, 2025 【PDF】

232. Zhaochen Liu, Limeng Qiao, Xiangxiang Chu, Lin Ma, Tingting Jiang. Towards Efficient Foundation Model for Zero-shot Amodal Segmentation in Proceedings of IEEE/CVF Conference on Computer Vision and Pattern Recognition, Nashville, USA, pp.20254-20264, 2025 【PDF】

233. Haopeng Lu, Ruiqi Li, Qian Yin, Li Song, Xinfeng Zhang, Shanshe Wang, Siwei Ma, Wen Gao. MoRLACS: A Monocular RGBD-based Locomotion Approach for CAVE Systems in Proceedings of International Conference on Multimedia Retrieval, Chicago, IL, USA, pp.926-934, 2025 【PDF】

234. Nan Huang, Wenzhao Zheng, Chenfeng Xu, Kurt Keutzer, Shanghang Zhang, Angjoo Kanazawa, Qianqian Wang. Segment Any Motion in Videos in Proceedings of the IEEE/CVF Computer Vision and Pattern Recognition Conference, Nashville, USA, 2025 【PDF】

235. Jinchang Xu, Shaokang Wang, Jintao Chen, Zhe Li, Peidong Jia, Fei Zhao, Guoqing Xiang, Zhijian Hao, Shanghang Zhang, Xiaodong Xie. Decouple Distortion from Perception: Region Adaptive Diffusion for Extreme-low Bitrate Perception Image Compression in Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, Nashville, USA, 2025 【PDF】

236. Yueru Jia, Jiaming Liu, Sixiang Chen, Chenyang Gu, Zhilve Wang, Xiaoqi Li, Longzan Luo, Pengwei Wang, Renrui Zhang, Zhongyuan Wang, Shanghang Zhang. Lift3D Policy: Lifting 2D Foundation Models for Robust 3D Robotic Manipulation in Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, Nashville, USA, 2025 【PDF】

237. Jiajun Cao, Yuan Zhang, Tao Huang, Ming Lu, Qizhe Zhang, Ruichuan An, Ningning MA, Shanghang Zhang. MoVE-KD: Knowledge Distillation for VLMs with Mixture of Visual Encoders in Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, Nashville, USA, 2025 【PDF】

238. Xiaoqi Li, Lingyun Xu, Mingxu Zhang, Jiaming Liu, Yan Shen, Iaroslav Ponomarenko, Jiahui Xu, Liang Heng, Siyuan Huang, Shanghang Zhang, Hao Dong. Object-Centric Prompt-Driven Vision-Language-Action Model for Robotic Manipulation in Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, Nashville, USA, 2025 【PDF】

239. Yuheng Ji, Huajie Tan, Jiayu Shi, Xiaoshuai Hao, Yuan Zhang, Hengyuan Zhang, Pengwei Wang, Mengdi Zhao, Yao Mu, Pengju An, Xinda Xue, Qinghang Su, Huaihai Lyu, Xiaolong Zheng, Jiaming Liu, Zhongyuan Wang, Shanghang Zhang. RoboBrain: A Unified Brain Model for Robotic Manipulation from Abstract to Concrete in Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, Nashville, USA, 2025 【PDF】

240. Renkai Wu, Xianjin Wang, Pengchen Liang, Zhenyu Zhang, Qing Chang, Hao Tang. Toward Zero-Shot Learning for Visual Dehazing of Urological Surgical Robots in Proceedings of IEEE International Conference on Robotics and Automation, Atlanta, USA, 2025 【PDF】

241. Yanchen Zhao, Jiaye Fu, Zhaoyu Li, Qizhe Wang, Zhimeng Huang, Jiaqi Zhang, Chuanmin Jia, Siwei Ma. Advanced Learning-Based Coding Tools for ECM: Intra Prediction and In-Loop Filtering in Proceedings of IEEE International Symposium on Circuits and Systems, London, United Kingdom, pp.1-5, 2025 【PDF】

242. Ji Ma, Hongming Dai, Yao Mu, Pengying Wu, Hao Wang, Xiaowei Chi, Yang Fei, Shanghang Zhang, Chang Liu. DOZE: A Dataset for Open-Vocabulary Zero-Shot Object Navigation in Dynamic Environments in Proceedings of the International Conference on Robotics and Automation, Atlanta, USA, 2025 【PDF】

243. Nan Huang, Ting Zhang, Yuhui Yuan, Dong Chen, Shanghang Zhang. High-Quality 3D Creation from A Single Image Using Subject-Specific Knowledge Prior in Proceedings of the International Conference on Robotics and Automation, Atlanta, USA, 2025 【PDF】

244. Jianing Li, Hao Wang, Guxixi Gu Chenyang, Ming Lu, Wenzhao Zheng, LI DU, Shanghang Zhang. SliceOcc: Indoor 3D Semantic Occupancy Prediction with Vertical Slice Representation in Proceedings of the International Conference on Robotics and Automation, Atlanta, USA, 2025 【PDF】

245. Xingqun Qi, Yatian Wang, Hengyuan Zhang, Jiahao Pan, Wei Xue, Shanghang Zhang, Wenhan Luo, Qifeng Liu, Yike Guo. Co3Gesture: Towards Coherent Concurrent Co-speech 3D Gesture Generation with Interactive Diffusion in Proceedings of the International Conference on Learning Representations, Singapore, 2025 【PDF】

246. Weifeng Lin, Xinyu Wei, Ruichuan An, Peng Gao, Bocheng Zou, Yulin Luo, Siyuan Huang, Shanghang Zhang, Hongsheng Li. Draw-and-Understand: Leveraging Visual Prompts to Enable MLLMs to Comprehend What You Want in Proceedings of the International Conference on Learning Representations, Singapore, 2025 【PDF】

247. Renrui Zhang, Xinyu Wei, Dongzhi Jiang, Yichi Zhang, Ziyu Guo, Chengzhuo Tong, Jiaming Liu, Aojun Zhou, Shanghang Zhang, Peng Gao, Hongsheng Li. MAVIS: Mathematical Visual Instruction Tuning with an Automatic Data Engine in Proceedings of the International Conference on Learning Representations, Singapore, 2025 【PDF】

248. Xinyu Hang, Shenpeng Song, Zhimeng Huang, Chuanmin Jia, Siwei Ma, Wen Ga. Rethinking Bjontegaard Delta for Compression Efficiency Evaluation: Are We Calculating It Precisely and Reliably in Proceddings of 2025 Data Compression Conferen, Utah, USA, pp.370-370, 2025 【PDF】

249. Wang Qizhe, Yin Qian, Huang Zhimeng, Jiang Weijia, Su Yi, Ma Siwei, Zhang Jiaqi. Compressed Domain Prior-Guided Video Super-Resolution for Cloud Gaming Content in Proceddings of 2025 Data Compression Conference, Utah, USA, pp.83-92, 2025 【PDF】

250. Longtao Feng, Qian Yin, Jiaqi Zhang, Lin Li, Qi Wang and Siwei Ma. A Fast Bit Allocation Refinement for Video Rate Control in Proceedings of 2025 Data Compression Conference, Utah, USA, pp.366-366, 2025 【PDF】

251. Shuhong Liao, Kexiang Feng, Zhimeng Huang, Siwei Ma, Qi Wang, Lili Chen, Chuanmin J. Dynamic Temporal Reference Aggregation for Neural Video Compression in Proceedings of 2025 Data Compression Conference, Utah, USA, pp.13-22, 2025 【PDF】

252. Xin Liu, Yuhuai Zhang, Jiaqi Zhang, Yi Su, Weijia Jiang, Siwei Ma. Enhanced Decoder-side Secondary Transform Derivation for Video Coding beyond AVS3 in Proceedings of 2025 Data Compression Conference, Utah, USA, pp.388-388, 2025 【PDF】

253. Zetian Song, Jiaqi Zhang, Chuanmin Jia, Qi Wang, Lili Chen, Siwei Ma, Wen Gao. FAPC: Frequency-Based Adaptive Pixel Correction for Compressed Screen Content in Proceedings of 2025 Data Compression Conference, Utah, USA, pp.343-352, 2025 【PDF】

254. Zhimeng Huang, Junlong Gao, Jiaqi Zhang, Shanshe Wang, Siwei Ma, Wen Gao, Chuanmin Jia. Image Coding for Machine with Visual-Language Mimic Feature Learning in Proceedings of 2025 Data Compression Conference, Utah, USA, pp.373-373, 2025 【PDF】

255. Jiaye Fu, Xuewei Meng, Jiaqi Zhang, Siwei Ma, Yao-Jen Chang, Vadim Seregin, and Marta Karczewicz. Recurrent Intra Prediction Coding for Future Video Coding in Proceedings of 2025 Data Compression Conference, Utah, USA, pp.183-192, 2025 【PDF】

256. Kexiang Feng, Shuhong Liao, Zhimeng Huang, Chuanmin Jia, Qi Wang, Lili Chen, Siwei Ma and Wen Gao. STACO: Spatio-Temporal Adaptive Context Optimization for Neural Video Compression in Proceedings of 2025 Data Compression Conference, Utah, USA, pp.365-365, 2025 【PDF】

257. Jiaoyang Yin, Bin Fan, Chao Xu, Tiejun Huang, Boxin Shi. Spk2ImgMamba: Spiking camera image reconstruction with multi-scale state space models in Proceedings of IEEE/CVF Winter Conference on Applications of Computer Vision, Tucson, AZ, USA, 2025 【PDF】

258. Xiaofeng Zhang, Yihao Quan, Chen Shen, Xiaosong Yuan, Shaotian Yan, Liang Xie, Wenxiao Wang, Chaochen Gu, Hao Tang, Jieping Ye. From Redundancy to Relevance: Information Flow in LVLMs Across Reasoning Tasks in Proceedings of The Nations of the Americas Chapter of the Association for Computational Linguistics, Albuquerque, USA, 2025 【PDF】

259. Yifei Xia, Chu Zhou, Chengxuan Zhu, Chao Xu, Boxin Shi. PlaNet: Learning to mitigate atmospheric turbulence in planetary images in Proceedings of AAAI Conference on Artificial Intelligence, Philadelphia, PA, USA, 2025 【PDF】

260. Chu Zhou, Chao Xu, Boxin Shi. Polarization guided mask-free shadow removal in Proceedings of AAAI Conference on Artificial Intelligence, Philadelphia, PA, USA, 2025 【PDF】

261. Yuxuan Zhang, Qing Zhang, Yiren Song, Jichao Zhang, Hao Tang, Jiaming Liu. Stable-Hair: Real-World Hair Transfer via Diffusion Model in Proceedings of AAAI Conference on Artificial Intelligence, Philadelphia, USA, 2025 【PDF】

262. Jun Liu, Zhenglun Kong, Pu Zhao, Changdi Yang, Hao Tang, Xuan Shen, Geng Yuan, Wei Niu, Wenbin Zhang, Xue Lin, Dong Huang, Yanzhi Wang. Toward Adaptive Large Language Models Structured Pruning via Hybrid-grained Weight Importance Assessment in Proceedings of AAAI Conference on Artificial Intelligence, Philadelphia, USA, 2025 【PDF】

263. Jianan Jiang, Hao Tang, Zhilin Jiang, Weiren Yu, Di Wu. Towards Self-Supervised FG-SBIR with Unified Sample Feature Alignment and Multi-Scale Token Recycling in Proceedings of AAAI Conference on Artificial Intelligence, Philadelphia, USA, 2025 【PDF】

264. Yan Huang, Xiaoshan Liao, Jinxiu Liang, Yuhui Quan, Boxin Shi, Yong Xu. Zero-shot low-light image enhancement via latent diffusion models in Proceedings of AAAI Conference on Artificial Intelligence, Philadelphia, PA, USA, 2025 【PDF】

265. Senqiao Yang, Jiaming Liu, Renrui Zhang, Mingjie Pan, Ziyu Guo, Xiaoqi Li, Zehui Chen, Peng Gao, Hongsheng Li, Yandong Guo, Shanghang Zhang. LiDAR-LLM: Exploring the Potential of Large Language Models for 3D LiDAR Understanding in Proceedings of the AAAI Conference on Artificial Intelligence, Philadelphia, USA, 2025 【PDF】

266. Bowen Liu, Haoyang Li, Shuning Wang, Shuo Nie, Shanghang Zhang. Subgraph Aggregation for Out-of-Distribution Generalization on Graphs in Proceedings of the AAAI Conference on Artificial Intelligence, Philadelphia, USA, 2025 【PDF】

国内期刊 (Chinese Journal)

267. 张伟，马征宇，田永鸿，面向天地一体化算力网的类脑智能计算研究现状与展望中国科学基金, Vol.39,No.2,pp.218-228, 2025年4月【PDF】

268. 方维，朱耀宇，黄梓涵，姚满，余肇飞，田永鸿，脉冲深度学习梯度替代算法研究综述计算机学报, Vol.48,No.8,pp.1885-1922, 2025年3月【PDF】

视频与视觉技术国家工程研究中心NATIONAL ENGINEERING RESEARCH CENTER OF VISUAL TECHNOLOGY