2024年度论文【267篇】-视频与视觉技术国家工程研究中心

位置 : 首页 > 论文

2024年度论文【267篇】

视频与视觉技术国家工程研究中心

国际期刊（International Journal）

1. Lianlin Li, Shengguo Hu, Mingyi Li, Jiawen Xu, Hongrui Zhang, Shanghang Zhang, Tie Jun Cui, and Philipp del Hougne. Electromagnetic metamaterial agent Light: Science & Applications. Sept.2024 【PDF】

2. Jiayu Yang,Chunhui Yang,Fei Xiong,Yongqi Zhai,Ronggang Wang. Learned Video Compression with Adaptive Temporal Prior and Decoded Motion-aided uality Enhancement ACM Transactions on Multimedia Computing, Communications, and Applications. Apr.2024 【PDF】

3. Zhanyuan Cai, Wenxu Gao, Ge Li, Wei Gao. Distortion Propagation Model-based V-PCC Rate Control for 3D Point Cloud Broadcasting IEEE Transactions on Broadcasting. Dec.2024 【PDF】

4. Chenxi Yang, Yujia Liu, Dingquan Li and Tingting Jiang. Exploring Vulnerabilities of No-Reference Image Quality Assessment Models: A Query-Based Black-Box Method IEEE Transactions on Circuits and Systems for Video Technology. Vol.34, No.12, pp.12715-12729,Dec.2024 【PDF】

5. Li Yuan, Tao Wang, Xiaopeng Zhang, Francis Eng Hock Tay, Zequn Jie, Yonghong Tian. Learnable Central Similarity Quantization for Efficient Image and Video Retrieval IEEE Transactions on Neural Networks and Learning Systems. Vol.35, No.12, pp.18717-18730,Dec.2024 【PDF】

6. Shunan Mao, Hao Chen, Yaowei Wang, Wei Zeng, Shiliang Zhang. TPTE: Text-guided Patch Token Exploitation for Unsupervised Fine-Grained Representation Learning ACM Transactions on Multimedia Computing, Communications, and Applications. Vol.20, No.11, pp.1 - 18,Nov.2024 【PDF】

7. Dinghao Yang, Wei Gao. PointCHD: A Point Cloud Benchmark for Congenital Heart Disease Classification and Segmentation IEEE Journal of Biomedical and Health Informatics. Nov.2024 【PDF】

8. Yan Huang, Xiaoshan Liao, Jinxiu Liang, Boxin Shi, Yong Xu, Patrick Le Callet. Detail preserving diffusion models for low-light image enhancement IEEE Transactions on Circuits and Systems for Video Technology. Nov.2024 【PDF】

9. Xuanyu Zhang, Bin Chen, Wenzhen Zou, Shuai Liu, Yongbing Zhang, Ruiqin Xiong, Jian Zhang. Progressive Content-aware Coded Hyperspectral Compressive Imaging IEEE Transactions on Circuits and Systems for Video Technology. Vol.34, No.11, pp.10817-10830,Nov.2024 【PDF】

10. Tianci Li, Xiaofeng Huang, Yansong Li, Nemin Qiu, Haibing Yin, Chuang Zhu, Yuan Li. An FPGA Accelerator Design of Spiking Neural Network for Energy-Efficient Object Detection IEEE Transactions on Consumer Electronics. Nov.2024 【PDF】

11. Yuan Li, Wei Gao, Ge Li, Siwei Ma. Saliency Segmentation Oriented Deep Image Compression with Novel Bit Allocation IEEE Transactions on Image Processing. Vol.34, pp.16-29,Nov.2024 【PDF】

12. Bin Fan, Zhexiong Wan, Boxin Shi, Chao Xu, Yuchao Dai. Unified video reconstruction for rolling shutter and global shutter cameras IEEE Transactions on Image Processing. Nov.2024 【PDF】

13. Hao Chen, Francois Bremond, Nicu Sebe, Shiliang Zhang. Anti-Forgetting Adaptation for Unsupervised Person Re-Identification IEEE Transactions on Pattern Analysis and Machine Intelligence. pp.1-16,Nov.2024 【PDF】

14. Bin Chen, Jian Zhang. Practical Compact Deep Compressed Sensing IEEE Transactions on Pattern Analysis and Machine Intelligence. pp.1-17,Nov.2024 【PDF】

15. Zhanzhou Feng, Shiliang Zhang. Evolved Hierarchical Masking for Self-Supervised Learning IEEE Transactions on Pattern Analysis and Machine Intelligence. pp.1-16,Nov.2024 【PDF】

16. Chong Mou, Xintao Wang, Yanze Wu, Ying Shan, Jian Zhang. Empowering Real-World Image Super-Resolution with Flexible Interactive Modulation IEEE Transactions on Pattern Analysis and Machine Intelligence. Vol.46, No.11, pp.7317-7330,Nov.2024 【PDF】

17. Shuzhou Yang, Xuanyu Zhang, Yinhuai Wang, Jiwen Yu, Yuhan Wang, Jian Zhang. DiffLLE: Diffusion-guided Domain Calibration for Unsupervised Low-light Image Enhancement International Journal of Computer Vision. Nov.2024 【PDF】

18. Yiting Shao, Xiaodong Yang, Wei Gao, Shan Liu, Ge Li. 3D Point Cloud Attribute Compression Using Diffusion-Based Texture-Aware Intra Prediction IEEE Transactions on Circuits and Systems for Video Technology. Vol.34, No.10, pp.9633-9646,Oct.2024 【PDF】

19. Weiqi Li, Bin Chen, Shuai Liu, Shijie Zhao, Bowen Du, Yongbing Zhang, Jian Zhang. D3C2-Net: Dual-Domain Deep Convolutional Coding Network for Compressive Sensing IEEE Transactions on Circuits and Systems for Video Technology. Vol.34, No.10, pp.9341-9355,Oct.2024 【PDF】

20. [10] Xuesong Gao, Keqiu Li, Xiulong Liu, Jie Nie, Weiqiang Chen, Yonghong Tian. Privacy-Preserving 3D Skeleton-Based Video Action Recognition via Graph Convolution Network IEEE Transactions on Consumer Electronics. Oct.2024 【PDF】

21. Shiyu Xuan, Ming Yang, Shiliang Zhang. Adapting Vision-Language Models via Learning to Inject Knowledge IEEE Transactions on Image Processing. Vol.33, pp.5798-5809,Oct.2024 【PDF】

22. Songlin Fan, Wei Gao*, Ge Li. Point-MPP: Point Cloud Self-supervised Learning from Masked Position Prediction IEEE Transactions on Neural Networks and Learning Systems. Oct.2024 【PDF】

23. Qinqin Zhou, Kekai Sheng, Xiawu Zheng, Ke Li, Yonghong Tian, Jie Chen, Rongrong Ji. Training-Free Transformer Architecture Search With Zero-Cost Proxy Guided Evolution IEEE Transactions on Pattern Analysis and Machine Intelligence. Vol.46, No.10, pp.6525-6541,Oct.2024 【PDF】

24. Mengyue Geng, Lizhi Wang, Lin Zhu, Wei Zhang, Ruiqin Xiong, Yonghong Tian. Towards Ultra High-Speed Hyperspectral Imaging by Integrating Compressive and Neuromorphic Sampling International Journal of Computer Vision. Oct.2024 【PDF】

25. Haonan Qiu, Munan Ning, Zeyin Song, Wei Fang, Yanqi Chen, Tao Sun, Zhengyu Ma, Li Yuan, Yonghong Tian. Self-architectural knowledge distillation for spiking neural networks Neural Networks. Vol.178, Oct.2024 【PDF】

26. Tai Qin, Ge Li, Wei Gao, Shan Liu. Multi-grained Point Cloud Geometry Compression via Dual-model Prediction with Extended Octree ACM Transactions on Multimedia Computing, Communications, and Applications. Vol.20, No.9, Sept.2024 【PDF】

27. Chunhui Yang, Jiayu Yang, Yongqi Zhai, Ronggang Wang. FICNet: An End to End Network for Free-view Image Coding IEEE Transactions on Circuits and Systems for Video Technology. Vol.34, No.9, pp.8848-8861,Sept.2024 【PDF】

28. Bin Fan, Ying Guo, Yuchao Dai, Chao Xu, Boxin Shi. Self-Supervised Learning for Rolling Shutter Temporal Super-Resolution IEEE Transactions on Circuits and Systems for Video Technology. Sept.2024 【PDF】

29. [5] Mengyue Geng, Lizhi Wang, Lin Zhu, Wei Zhang, Ruiqin Xiong, Yonghong Tian. Event-enhanced Snapshot Mosaic Hyperspectral Frame Deblurring IEEE Transactions on Pattern Analysis and Machine Intelligence. Vol.47, No.1, pp.206-223,Sept.2024 【PDF】

30. Yifan Zhao, Jia Li, Zeyin Song, Yonghong Tian. Language-Inspired Relation Transfer for Few-shot Class-Incremental Learning IEEE Transactions on Pattern Analysis and Machine Intelligence. pp.1-14,Sept.2024 【PDF】

31. Hong You, Xian Zhong, Wenxuan Liu, Qi Wei, Wenxin Huang, Zhaofei Yu, Tiejun Huang. Converting Artificial Neural Networks to Ultra-Low-Latency Spiking Neural Networks for Action Recognition IEEE Transactions on Cognitive and Developmental Systems. Vol.16, pp.1533 - 1545,Aug.2024 【PDF】

32. Bin Chen, Xuanyu Zhang, Shuai Liu, Yongbing Zhang, Jian Zhang. Self-Supervised Scalable Deep Compressed Sensing International Journal of Computer Vision. Aug.2024 【PDF】

33. Ruyi Yang, Peng Zhao, Liyang Wang, Chenli Feng, Chen Peng, Zhexuan Wang, Yingying Zhang,..., Shanshan Jia, Zhaofei Yu, Jian Liu, Fei Wang,..., Xingtao Zhou, Chunhui Jiang, Yuanzhi Yuan, Biao Yan, Jiayi Zhang. Assessment of Visual Function in Blind Mice and Monkeys with Subretinally Implanted Nanowire Arrays as Artificial Photoreceptors Nature Biomedical Engineering. pp.1018–1039,Aug.2024 【PDF】

34. 1. Bo Xiong, Changqing Su, Zihan Lin, You Zhou, Zhaofei Yu.. INeAT: An Artifact-Suppressed and Resolution-Enhanced Computed Tomography through Iterative Neural Adaptive Tomography Optics Express. Vol.32, pp.30943-32563,Aug.2024 【PDF】

35. Ye Chen, Peter Beech, Ziwei Yin, Shanshan Jia, Jiayi Zhang, Zhaofei Yu, Jian K Liu. Decoding Dynamic Visual Scenes across the Brain Hierarchy PLOS Computational Biology. pp.e1012297,Aug.2024 【PDF】

36. Kaiwei Che, Zhaokun Zhou, Jun Niu, Zhengyu Ma, Wei Fang, Yanqi Chen, Shuaijie Shen, Li Yuan, Yonghong Tian. Auto-Spikformer: Spikformer architecture search Frontiers in Neuroscience. Vol.18, July 2024 【PDF】

37. Qi Xingqun, Zhuojie Wu, Wenxuan Zou, Min Ren, Yifan Gao, Muyi Sun, Shanghang Zhang, Caifeng Shan, and Zhenan Sun. Exploring generalizable distillation for efficient medical image segmentation IEEE Journal of Biomedical and Health Informatics. July 2024 【PDF】

38. Wenhan Yang, Haofeng Huang, Yueyu Hu, Ling-Yu Duan, Jiaying Liu. Video Coding for Machines: Compact Visual Representation Compression for Intelligent Collaborative Analytics IEEE Trans. on Pattern Analysis and Machine Intelligence. Vol.46, No.7, pp.5174-5191,July 2024 【PDF】

39. Junwei Zhao, Shiliang Zhang, Zhaofei Yu, Tiejun Huang. SpiReco: Fast and Efficient Recognition of High-Speed Moving Objects with Spike Cameras IEEE Transactions on Circuits and Systems for Video Technology. Vol.34, No.7, pp.5856-5867,July 2024 【PDF】

40. Yuanhong Tang, Lingling An, Xingyu Zhang, Huiling Huang, Zhaofei Yu. Regulating Temporal Neural Coding via Fast and Slow Synaptic Dynamics IEEE Transactions on Cognitive and Developmental Systems. pp.1-14,July 2024 【PDF】

41. Zhaojian Yao, Wei Gao. Iterative Saliency Aggregation and Assignment Network for Efficient Salient Object Detection in Optical Remote Sensing Images IEEE Transactions on Geoscience and Remote Sensing. Vol.62, July 2024 【PDF】

42. Minggui Teng, Hanyue Lou, Yixin Yang, Tiejun Huang, Boxin Shi. Hybrid all-in-focus imaging from neuromorphic focal stack IEEE Transactions on Pattern Analysis and Machine Intelligence. Vol.46, No.12, pp.10124-10137,July 2024 【PDF】

43. Shiyu Xuan, Ming Yang, Shiliang Zhang. Incremental Model Enhancement via Memory-based Contrastive Learning International Journal of Computer Vision. July 2024 【PDF】

44. Yongxing Dai, Yifan Sun, Jun Liu, Zekun Tong, Ling-Yu Duan. Bridging the source-to-target gap for cross-domain person re-identification with intermediate domains International Journal of Computer Vision. Vol.2024, No.1, pp.1-24,July 2024 【PDF】

45. Pengchong Qiao, Yu Wang, Chang Liu, Lei Shang, Baigui Sun, Zhennan Wang, Xiawu Zheng, Rongrong Ji, Jie Chen. Adaptive Fuzzy Positive Learning for Annotation-Scarce Semantic Segmentation, International Journal of Computer Vision International Journal of Computer Vision. July 2024 【PDF】

46. Shanghang Zhang, Gaole Dai, Tiejun Huang, Jianxu Chen. Multimodal Large Language Model for Biological Image Analysis Nature Methods. July 2024 【PDF】

47. Shuai Liu, Bin Chen, Wenzhen Zou, Hao Sha, Xiaochen Feng, Sanyang Han, Xiu Li, Xuri Yao, Jian Zhang, Yongbing Zhang. Compressive confocal microscopy imaging at the single-photon level with ultra-low sampling ratios Nature Communications Engineering. June 2024 【PDF】

48. Yujia Peng, Jiaheng Han, Zhenliang Zhang, Lifeng Fan, Tengyu Liu, Siyuan Qi, Xue Feng, Yuxi Ma, Yizhou Wang, Song-Chun Zhu. The Tong Test: Evaluating Artificial General Intelligence Through Dynamic Embodied Physical and Social Interactions Engineering. Vol.34, No.3, pp.12-22,May 2024 【PDF】

49. Ziqing Ge, Siwei Ma, Wen Gao, Jingshan Pan, Chuanmin Jia. NLIC: Non-uniform Quantization based Learned Image Compression IEEE Transactions on Circuits and Systems for Video Technology. Vol.34, No.10, pp.9647 - 9663,May 2024 【PDF】

50. Wang Liu, Wei Gao, Ge Li, Siwei Ma, Tiesong Zhao, Hui Yuan. Enlarged Motion-Aware and Frequency-Aware Network for Compressed Video Artifact Reduction IEEE Transactions on Circuits and Systems for Video Technology. Vol.34, No.10, pp.10339-10352,May 2024 【PDF】

51. Yiting Shao, Xiaodong Yang, Wei Gao, Shan Liu, Ge Li. 3D Point Cloud Attribute Compression Using Diffusion-Based Texture-Aware Intra Prediction IEEE Transactions on Circuits and Systems for Video Technology. Vol.34, No.10, pp.9633-9646,May 2024 【PDF】

52. Li Ma, Yifan Zhao, Peixi Peng, Yonghong Tian. Sensitivity Decouple Learning for Image Compression Artifacts Reduction IEEE Transactions on Image Processing. Vol.33, pp.3620-3633,May 2024 【PDF】

53. Jiaming Liu, Qizhe Zhang, Xiaoqi Li, Jianing Li, Guanqun Wang, Ming Lu, Tiejun Huang, Shanghang Zhang. Unsupervised Spike Depth Estimation via Cross-modality Cross-domain Knowledge Transfer in Proceedings of the International Conference on Robotics and Automation. May 2024 【PDF】

54. Xiaotian Yu, Hanling Yi, Qie Tang, Kun Huang, Wenze Hu, Shiliang Zhang, Xiaoyu Wang. Graph-Based Social Relation Inference with Multi-Level Conditional Attention Neural Networks. Vol.173, May 2024 【PDF】

55. Yakun Ju, Kin-Man Lam, Wuyuan Xie, Huiyu Zhou, Junyu Dong, Boxin Shi. Deep learning methods for calibrated photometric stereo and beyond IEEE Transactions on Pattern Analysis and Machine Intelligence. Vol.46, No.11, pp.7154-7172,Apr.2024 【PDF】

56. Qi Zhang, Shanshe Wang, Xinfeng Zhang, Chuanmin Jia, Zhao Wang, Siwei Ma, Wen Gao. Perceptual Video Coding for Machines via Satisfied Machine Ratio Modeling IEEE Transactions on Pattern Analysis and Machine Intelligence. Vol.46, No.12, pp.7651-7668,Apr.2024 【PDF】

57. Wentao Zhu, Xiaoxuan Ma, Dongyou Lu, Hai Ci, Jinlu Zhang, Jiaxin Shi, Feng Gao, Qi Tian, Yizhou Wang. Human Motion Generation: A Survey IEEE Transactions on Pattern Analysis and Machine Intelligence. Vol.46, No.4, pp.2430-2449,Apr.2024 【PDF】

58. Yuchen Hong, Yakun Chang, Jinxiu Liang, Lei Ma, Teijun Huang, Boxin Shi. Light flickering guided reflection removal International Journal of Computer Vision. Vol.132, pp.3933–3953,Apr.2024 【PDF】

59. Xiaoming Tao, Dingcheng Gao, Wenqi Zhang, Tianqi Liu, Shanghang Zhang, Bing Du, Yanjun Qin. A multimodal physiological dataset for driving behaviour analysis Nature Scientific Data. Apr.2024 【PDF】

60. Dingquan Li; Kede Ma; Jing Wang; Ge Li. Hierarchical Prior-Based Super Resolution for Point Cloud Geometry Compression IEEE Transactions on Image Processing. No.1965, pp.1976,Mar.2024 【PDF】

61. Shunan Mao, Shiliang Zhang. Robust Fine-Grained Visual Recognition with Neighbor-Attention Label Correction IEEE Transactions on Image Processing. Vol.33, pp.2614-2626,Mar.2024 【PDF】

62. Shiyu Xuan, Shiliang Zhang. Intra-Inter Domain Similarity for Unsupervised Person Re-Identification IEEE Transactions on Pattern Analysis and Machine Intelligence. Vol.46, No.3, pp.1171-1726,Mar.2024 【PDF】

63. Jianping Jiang, Jiahe Li, Baowen Zhang, Xiaoming Deng, Boxin Shi. EvHandPose: Event-based 3D hand pose estimation with sparse supervision IEEE Transactions on Pattern Analysis and Machine Intelligence. Vol.46, No.9, pp.6416-6430,Mar.2024 【PDF】

64. Zhen Yang, Jun Yue, Pedram Ghamisi, Shiliang Zhang, Jiayi Ma, Leyuan Fang. Open set recognition in the real world International Journal of Computer Vision. Vol.132, pp.3208-3231,Mar.2024 【PDF】

65. Ding Chen, Peixi Peng, Tiejun Huang, Yonghong Tian. Fully Spiking Actor Network With Intralayer Connections for Reinforcement Learning IEEE Transactions on Neural Networks and Learning Systems. pp.1-13,Feb.2024 【PDF】

66. Ruoke Yan, Qian Yin, Xinfeng Zhang, Qi Zhang, Gai Zhang, Siwei Ma. Pose-Driven Compression for Dynamic 3D Human via Human Prior Models IEEE Transactions on Pattern Analysis and Machine Intelligence. Vol.46, No.8, pp.5820-5834,Feb.2024 【PDF】

67. Zhanzhou Feng, Jiaming Xu, Lei Ma, Shiliang Zhang. Efficient Video Transformers via Spatial-temporal Token Merging for Action Recognition ACM Transactions on Multimedia Computing, Communications and Applications. Vol.20, No.4, pp.1-21,Jan.2024 【PDF】

68. Yunyao Yan, Guoqing Xiang, Huizhu Jia, Jie Chen, Xiaofeng Huang, Xiaodong Xie. Two-Stage Perceptual Quality Oriented Rate Control Algorithm for HEVC ACM Transactions on Multimedia Computing, Communications, and Applications. Jan.2024 【PDF】

69. Zhaofei Yu, Tong Bu, Yijun Zhang, Shanshan Jia, Tiejun Huang, Jian K Liu.. obust Decoding of Rich Dynamical Visual Scenes with Retinal Spikes IEEE Transactions on Neural Networks and Learning Systems. pp.1-14,Jan.2024 【PDF】

70. Yifan Zhao, Jia Li, Yonghong Tian. Parsing Objects at a Finer Granularity: A Survey, Machine Intelligence Research Machine Intelligence Research. Vol.21, pp.431-451,Jan.2024 【PDF】

71. Zhou, Yu, Jiajun Cao, Justin Sonneck, Sweta Banerjee, Stefanie Dörr, Anika Grüneboom, Kristina Lorenz, Shanghang Zhang, Jianxu Chen. EfficientBioAI: making bioimaging AI models efficient in energy and latency Nature Methods. Jan.2024 【PDF】

国际会议（International Conference）

72. Huiming Zhang, Wei Gao. End-to-End RGB-D Image Compression via Exploiting Channel-Modality Redundancy In Proceedings of the AAAI Conference on Artificial Intelligence, Canada, February, 2024 【PDF】

73. Ziluo Ding, Zeyuan Liu, Zhirui Fang, Kefan Su, Liwen Zhu, and Zongqing Lu. Multi-Agent Coordination via Multi-Level Communication Conference on Neural Information Processing Systems, Vancuver, Canada, 2024 【PDF】

74. Huajie Tan, Guoqing Xiang, Xiaodong Xie, Huizhu Jia. Joint Frame-Level and Block-Level Rate-Perception Optimized Preprocessing for Video Coding in Proceedings of ACM Multimedia Asia, Auckland,New Zealand, 2024 【PDF】

75. Liwei Huang, Zhengyu Ma, Liutao Yu, Huihui Zhou, Yonghong Tian. Long-Range Feedback Spiking Network Captures Dynamic and Static Representations of the Visual Cortex under Movie Stimuli in Proceedings of Annual Conference on Neural Information Processing Systems, Vancouver, Canada, 2024 【PDF】

76. Chenlin Zhou, Han Zhang, Zhaokun Zhou, Liutao Yu, Liwei Huang,Xiaopeng Fan, Li Yuan, Zhengyu Ma, Huihui Zhou, Yonghong Tian. QKFormer: Hierarchical Spiking Transformer using Q-K Attention in Proceedings of Annual Conference on Neural Information Processing Systems, Vancouver, Canada, 2024 【PDF】

77. Kefan Su, Yusen Huo, Zhilin Zhang, Shuai Dou, Chuan Yu, Jian Xu, Zongqing Lu, and Bo Zheng. A Novel Benchmark for Decision-Making in Uncertain and Competitive Games in Proceedings of Conference on Neural Information Processing Systems, Vancuver, Canada, 2024 【PDF】

78. Jiafei Lyu, Kang Xu, Jiacheng Xu, Mengbei Yan, Jing-Wen Yang, Zongzhang Zhang, Chenjia Bai, Zongqing Lu, and Xiu Li. ODRL: A Benchmark for Off-Dynamics Reinforcement Learning in Proceedings of Conference on Neural Information Processing Systems, Vancuver, Canada, 2024 【PDF】

79. Xiaopeng Yu, Jiechuan Jiang, and Zongqing Lu. Opponent Modeling based on Subgoal Inference in Proceedings of Conference on Neural Information Processing Systems, Vancuver, Canada, 2024 【PDF】

80. Haoqi Yuan, Yuhui Fu, Feiyang Xie, and Zongqing Lu. Pre-Trained Multi-Goal Transformers with Prompt Optimization for Efficient Online Adaptation in Proceedings of Conference on Neural Information Processing Systems, Vancuver, Canada, 2024 【PDF】

81. Chu Zhou, Yixing Liu, Chao Xu, Boxin Shi. Quality-improved and property-preserved polarimetric imaging via complementarily fusing in Proceedings of Conference on Neural Information Processing Systems, Vancouver, Canada, 2024 【PDF】

82. Shaoteng Liu, Haoqi Yuan, Minda Hu, Yanwei Li, Yukang Chen, Shu Liu, Zongqing Lu, and Jiaya Jia. RL-GPT: Integrating Reinforcement Learning and Code-as-policy in Proceedings of Conference on Neural Information Processing Systems, Vancuver, Canada, 2024 【PDF】

83. Youwei Lyu, Heng Guo, Kailong Zhang, Si Li, Boxin Shi. SfPUEL: Shape from polarization under unknown environment light in Proceedings of Conference on Neural Information Processing Systems, Vancouver, Canada, 2024 【PDF】

84. Bin Fan, Jiaoyang Yin, Yuchao Dai, Chao Xu, Tiejun Huang, Boxin Shi. Spatiotemporal interactive learning for efficient image reconstruction of spiking cameras in Proceedings of Conference on Neural Information Processing Systems, Vancouver, Canada, 2024 【PDF】

85. Hanyue Lou, Jinxiu Liang, Minggui Teng, Bin Fan, Yong Xu, Boxin Shi. Zero-shot event-intensity asymmetric stereo via visual prompting from image domain in Proceedings of Conference on Neural Information Processing Systems, Vancouver, Canada, 2024 【PDF】

86. Longtao Feng, Qian Yin, Huiwen Ren, Zhao Wang, Siwei Ma and Yuwen He. Adaptive Block-Level Quality Parameter Adjustment Towards Low Video Bit-Rate Fluctuation in Proceedings of IEEE Visual Communications and Image Processing, Tokyo, Japan, 2024 【PDF】

87. Yanchen Zhao, Wenhong Duan, Chuanmin Jia, Shanshe Wang, Siwei Ma. Advanced Learning-Based Inter Prediction for Future Video Coding in Proceedings of IEEE Visual Communications and Image Processing, Tokyo, Japan, 2024 【PDF】

88. Wuyang Zheng, Jiarui Meng, Jiaqi Zhang, Jian Zhang, Siwei Ma. Hybrid Representation for 4D Medical Image Compression in Proceedings of IEEE Visual Communications and Image Processing, Tokyo, Japan, 2024 【PDF】

89. Jiarui Meng, Haijie Li, Yanmin Wu, Qiankun Gao, Shuzhou Yang, Jian Zhang, Siwei Ma. Mirror-3DGS: Incorporating Mirror Reflections into 3D Gaussian Splatting in Proceedings of IEEE Visual Communications and Image Processing, Tokyo, Japan, 2024 【PDF】

90. Zecheng Hao, Xinyu Shi, Yujia Liu, Zhaofei Yu, Tiejun Huang. Enhancing Adversarial Robustness in SNNs with Sparse Gradients in Proceedings of International Conferenceon Machine Learning, Vancouver, Canada, 2024 【PDF】

91. Yajing Zheng, Jiyuan Zhang, Zhaofei Yu, Tiejun Huang. Continuous Spatiotemporal Events Decoupling through Spike-based Bayesian Computation in Proceedings of Neural Information Processing Systems, Vancouver, Canada, 2024 【PDF】

92. Peng Li, Yuan Liu, Xiaoxiao Long, Feihu Zhang, Cheng Lin, Mengfei Li, Xingqun Qi, Shanghang Zhang, Wei Xue, Wenhan Luo, Ping Tan, Wenping Wang, Qifeng Liu, Yike Guo. Era3D: High-Resolution Multiview Diffusion using Efficient Row-wise Attention in Proceedings of Neural Information Processing Systems, Vancouver, Canada, 2024 【PDF】

93. Jiaming Liu, Mengzhen Liu, Zhenyu Wang, Pengju An, Xiaoqi Li, Kaichen Zhou, Senqiao Yang, Renrui Zhang, Yandong Guo, Shanghang Zhang. RoboMamba: Efficient Vision-Language-Action Model for Robotic Reasoning and Manipulation in Proceedings of Neural Information Processing Systems, Vancouver, Canada, 2024 【PDF】

94. Kang Chen, Shiyan Chen, Jiyuan Zhang, Baoyue Zhang, Yajing Zheng, Tiejun Huang, Zhaofei Yu. SpikeReveal: Unlocking Temporal Sequences from Real Blurry Inputs with Spike Streams in Proceedings of Neural Information Processing Systems, Vancouver, Canada, 2024 【PDF】

95. Zhaokun Zhou, Yijie Lu, Yanhao Jia, Kaiwei Che, Jun Niu, Liwei Huang, Xinyu Shi, Yuesheng Zhu, Guoqi Li, Zhaofei Yu, Li Yuan. Spiking Transformer with Experts Mixture in Proceedings of Neural Information Processing Systems, Vancouver, Canada, 2024 【PDF】

96. Yuan Zhang, Fei xiao, Tao Huang, Chun-Kai Fan, Hongyuan Dong, Jiawen Li, Jiacong Wang, Kuan Cheng, Shanghang Zhang, Haoyuan Guo. Unveiling the Tapestry of Consistency in Large Vision-Language Models in Proceedings of Neural Information Processing Systems, Vancouver, Canada, 2024 【PDF】

97. Haotian Zhang, Junting Zhou, Haowei Lin, Hang Ye, Jianhua Zhu, Zihao Wang, Liangcai Gao, Yizhou Wang, Yitao Liang. CLoG: Benchmarking Continual Learning of Image Generation Models in Proceedings of NeurIPS 2024 Workshop on Scalable Continual Learning for Lifelong Foundation Models, Vancouver, Canada, 2024 【PDF】

98. Zhiyi Pan, Wei Gao, Shan Liu, Ge Li. Distribution Guidance Network for Weakly Supervised Point Cloud Semantic Segmentation in Proceedings of the 37th International Conference on Neural Information Processing Systems, Vancouver, British Columbia, Canada, 2024 【PDF】

99. Xuanyu Zhang, Jiarui Meng, Runyi Li, Zhipei Xu, Yongbing Zhang, Jian Zhang. GS-Hider: Hiding Messages into 3D Gaussian Splatting in Proceedings of the 37th International Conference on Neural Information Processing Systems, Vancouver, British Columbia, Canada, 2024 【PDF】

100. Qiankun Gao, Jiarui Meng, Chengxiang Wen, Jie Chen, Jian Zhang. HiCoM: Hierarchical Coherent Motion for Dynamic Streamable Scenes with 3D Gaussian Splatting in Proceedings of the 37th International Conference on Neural Information Processing Systems, Vancouver, British Columbia, Canada, 2024 【PDF】

101. Yanmin Wu, Jiarui Meng, Haijie Li, Chenming Wu, Yahao Shi, Xinhua Cheng, Chen Zhao, Haocheng Feng, Errui Ding, Jingdong Wang, Jian Zhang. OpenGaussian: Towards Point-Level 3D Gaussian-based Open Vocabulary Understanding in Proceedings of the 37th International Conference on Neural Information Processing Systems, Vancouver, British Columbia, Canada, 2024 【PDF】

102. Chong Mou, Mingdeng Cao, Xintao Wang, Zhaoyang Zhang, Ying Shan, Jian Zhang. ReVideo: Remake a Video with Motion and Content Control in Proceedings of the 37th International Conference on Neural Information Processing Systems, Vancouver, British Columbia, Canada, 2024 【PDF】

103. Shangkun Sun, Jiaming Liu, Huaxia Li, Guoqing Liu, Thomas H. Li, Wei Gao. StreamFlow: Streamlined Multi-Frame Optical Flow Estimation for Video Sequences in Proceedings of the 37th International Conference on Neural Information Processing Systems, Vancouver, British Columbia, Canada, 2024 【PDF】

104. Rui Peng, Wangze Xu, Luyang Tang, Liwei Liao, Jianbo Jiao, Ronggang Wang. Structure Consistent Gaussian Splatting with Matching Prior for Few-shot Novel View Synthesis in Proceedings of the 37th International Conference on Neural Information Processing Systems, Vancouver, British Columbia, Canada, 2024 【PDF】

105. Zhenyu Guan, Xiangyu Kong, Fangwei Zhong, Yizhou Wang. Richelieu: Self-Evolving LLM-Based Agents for AI Diplomacy in Proceedings of The Thirty-eighth Annual Conference on Neural Information Processing Systems, Vancouver, Canada, 2024 【PDF】

106. Jiangran Lv, Yuxing Chen, Tao Du, Feng Zhu, Huiquan Liu, Yizhou Wang, He Wang. ScissorBot: Learning Generalizable Scissor Skill for Paper Cutting via Simulation, Imitation, and Sim2Real in Proceedings of Conference on Robot Learning, Munich, Germany, 2024 【PDF】

107. Sha Guo, Lin Sui, Chenlin Zhang, Zhuo Chen, Wenhan Yang, Lingyu Duan. A Unified Image Compression Method for Human Perception and Multiple Vision Tasks in Proceedings of European Conference on Computer Vision, MiCo Milano, Italy, pp.342-359, 2024 【PDF】

108. Weicheng Xue, Kai Yang, Yongxiang Liu, Dengdong Fan, Pengxiang Xu, Yonghong Tian. Unlocking High Performance with Low-Bit NPUs and CPUs for Highly Optimized HPL-MxP on Cloud Brain II in Proceedings of International Conference for High Performance Computing, Networking, Storage and Analysis, Atlanta, USA, 2024 【PDF】

109. Xinyan Chen, Jiaxin Ge, Tianjun Zhang, Jiaming Liu, Shanghang Zhang. Learning from Mistakes: Iterative Prompt Relabeling for Text-to-Image Diffusion Model Training in Proceedings of the 2024 Conference on Empirical Methods in Natural Language Processing, Florida, USA, 2024 【PDF】

110. Shitian Zhao, Renrui Zhang, Xu Luo, Yan Wang, Shanghang Zhang, Peng Gao. Unleashing the Potentials of Likelihood Composition for Multi-modal Language Models in Proceedings of the 2024 Conference on Empirical Methods in Natural Language Processing, Florida, USA, 2024 【PDF】

111. Xiaobao Wei, Jiajun Cao, Yizhu Jin, Ming Lu, Guangyu Wang, Shanghang Zhang. I-MedSAM: Implicit Medical Image Segmentation with Segment Anything in Proceedings of the European Conference on Computer Vision, Milan, Italia, 2024 【PDF】

112. Bo Xiong, Changqing Su, Zihan Lin, Yanqin Chen, You Zhou, Zhen Cheng, Zhaofei Yu, Tiejun Huang. Real-time Parameter Evaluation of High-speed Microfluidic Droplets using Continuous Spike Streams. in Proceedings of ACM Multimedia, Melbourne, Australia, 2024 【PDF】

113. Zihan Huang, Xinyu Shi, Zecheng Hao, Tong Bu, Jianhao Ding, Zhaofei Yu, Tiejun Huang. SpikeGS: 3D Gaussian Splatting from Spike Streams with High-Speed Camera Motion in Proceedings of ACM Multimedia, Melbourne, Australia, 2024 【PDF】

114. Zimo Liu, Kangjun Liu, Mingyue Guo, Shiliang Zhang, Yaowei Wang. CoTuning: A Large-Small Model Collaborating Distillation Framework for Better Model Generalization in Proceedings of ACM Multimedia, Melbourne, Australia, pp.10487-10496, 2024 【PDF】

115. Yi Ma, Peiqi Duan, Yuchen Hong, Chu Zhou, Yu Zhang, Jimmy S. Ren, Boxin Shi. Color4E: Event demosaicing for full-color event guided image deblurring in Proceedings of ACM Multimedia Conference, Melbourne, Australia, 2024 【PDF】

116. Hao Luo, Bohan Zhou, and Zongqing Lu. Pre-Trained Visual Dynamics Representations for Efficient Policy Learning in Proceedings of European Conference on Computer Vision, Milan, Italy, 2024 【PDF】

117. Haobin Jiang, Junpeng Yue, Hao Luo, Ziluo Ding, and Zongqing Lu. Reinforcement Learning Friendly Vision-Language Model for Minecraft in Proceedings of European Conference on Computer Vision, Milan, Italy, 2024 【PDF】

118. Sipeng Zheng, Bohan Zhou, Yicheng Feng, Ye Wang, and Zongqing Lu. UniCode: Learning a Unified Codebook for Multimodal Large Language Models in Proceedings of European Conference on Computer Vision, Milan, Italy, 2024 【PDF】

119. Hao Luo, Zongqing Lu. Visual Grounding for Object-Level Generalization in Reinforcement Learning in Proceedings of European Conference on Computer Vision, Milan, Italy, 2024 【PDF】

120. Ruohua Shi, Qiufan Pang, Lei Ma, Lingyu Duan, Tiejun Huang, Tingting Jiang. ShapeMamba-EM: Fine-Tuning Foundation Model with Local Shape Descriptors and Mamba Blocks for 3D EM Image Segmentation in Proceedings of International Conference on Medical Image Computing and Computer-Assisted Intervention, Morocco, pp.731-741, 2024 【PDF】

121. Junqi Wu, Wenhong Duan, Xianping Ma, Jianhui Chang, Shanshe Wang, Siwei Ma and Chuanmin Jia. Extreme Low Bitrate Image Compression System for Mobile Deployment in Proceedings of International Workshop on Multimedia Signal Processing, West Lafayette, IN, USA, pp.1-6, 2024 【PDF】

122. Xiaotong Li,Fan Zhang,Haiwen Diao,Yueze Wang,Xinlong Wang,Lingyu Duan. Densefusion-1m: Merging vision experts for comprehensive multimodal perception in Proceedings of Neural Information Processing Systems, Vancouver, Canada, 2024 【PDF】

123. Chao Liu, Xueqing Yu, Dingyu Wang and Tingting Jiang. ACLNet: A Deep Learning Model for ACL Rupture Classification Combined with Bone Morphology in Proceedings of the 27th International Conference on Medical Image Computing and Computer-Assisted Intervention, Marrakech, Morocoo, 2024 【PDF】

124. Ruohua Shi, Qiufan Pang, Lei Ma, Lingyu Duan, Tingting Jiang, Tiejun Huang. ShapeMamba-EM: Fine-Tuning Foundation Model with Local Shape Descriptors and Mamba Blocks for 3D EM Image Segmentation in Proceedings of the 27th International Conference on Medical Image Computing and Computer-Assisted Intervention, Marrakech, Morocoo, 2024 【PDF】

125. Jinbo Yan, Rui Peng, Luyang Tang, Ronggang Wang. 4D Gaussian Splatting with Scale-aware Residual Field and Adaptive Optimization for Real-time Rendering of Temporally Complex Dynamic Scenes in Proceedings of the 32nd ACM International Conference on Multimedia, Melbourne VIC Australia, 2024 【PDF】

126. Liang Xie, Wei Gao. An Open-Source Library of Point Cloud Compression for Human and Machine Vision in Proceedings of the 32nd ACM International Conference on Multimedia, Melbourne VIC Australia, 2024 【PDF】

127. Panjun Duan, Yang Zhao, Yuan Chen, Wei Jia, Zhao Zhang, Ronggang Wang. Blind Video Bit-Depth Expansion in Proceedings of the 32nd ACM International Conference on Multimedia, Melbourne VIC Australia, 2024 【PDF】

128. Jie Liang, Rongjie Wang, Rui Peng, Zhe Zhang, Kaiqiang Xiong, Ronggang Wang. High Fidelity Aggregated Planar Prior Assisted PatchMatch Multi-View Stereo in Proceedings of the 32nd ACM International Conference on Multimedia, Melbourne VIC Australia, 2024 【PDF】

129. Changhao Peng, Wei Gao. Laplacian Matrix Learning for Point Cloud Attribute Compression with Ternary Search-Based Adaptive Block Partition in Proceedings of the 32nd ACM International Conference on Multimedia, Melbourne VIC Australia, 2024 【PDF】

130. Zhenyu Zhang, Guangyao Chen, Yixiong Zou, Zhimeng Huang, Yuhua Li, Ruixuan Li. MICM: Rethinking Unsupervised Pretraining for Enhanced Few-shot Learning in Proceedings of the 32nd ACM International Conference on Multimedia, Melbourne, Australia, pp.7686-7695, 2024 【PDF】

131. Wei Gao, Huiming Zheng, Chenhao Zhang, Kaiyu Zheng, Zhuozhen Yu, Yuan Li, Hua Ye, Yongchi Zhang. OpenDIC: An Open-Source Library and Performance Evaluation for Deep-learning-based Image Compression in Proceedings of the 32nd ACM International Conference on Multimedia, Melbourne, Australia, 2024 【PDF】

132. Hang Yuan, Wei Gao*, Wenxu Gao. OpenSEP: An Open Source Subjective Experiment Platform in Proceedings of the 32nd ACM International Conference on Multimedia, Melbourne VIC Australia, 2024 【PDF】

133. Weiqi Li, Shijie Zhao, Bin Chen, Xinhua Cheng, Junlin Li, Li Zhang, Jian Zhang. ResVR: Joint Rescaling and Viewport Rendering of Omnidirectional Images in Proceedings of the 32nd ACM International Conference on Multimedia, Melbourne VIC Australia, 2024 【PDF】

134. Liang Xie, Wei Gao, Huiming Zheng, Ge Li. ROI-Guided Point Cloud Geometry Compression Towards Human and Machine Vision in Proceedings of the 32nd ACM International Conference on Multimedia, Melbourne VIC Australia, 2024 【PDF】

135. Kexiang Feng, Chuanmin Jia, Siwei Ma, Wen Gao. Unifying Spike Perception and Prediction: A Compact Spike Representation Model Using Multi-scale Correlation in Proceedings of the 32nd ACM International Conference on Multimedia, Melbourne, Australia, pp.2341-2349, 2024 【PDF】

136. Xuanyu Zhang, Youmin Xu, Runyi Li, Jiwen Yu, Weiqi Li, Zhipei Xu, Jian Zhang. V2A-Mark: Versatile Deep Visual-Audio Watermarking for Manipulation Localization and Copyright Protection in Proceedings of the 32nd ACM International Conference on Multimedia, Melbourne VIC Australia, 2024 【PDF】

137. Rongyu Zhang, Zefan Cai, Huanrui Yang, Zidong Liu, Denis Gudovskiy, Tomoyuki Okuno, Yohei Nakata, Kurt Keutzer, Baobao Chang, Yuan Du, Li Du, Shanghang Zhang. VeCAF: Vision-language Collaborative Active Finetuning with Training Objective Awareness. in Proceedings of the 32nd ACM International Conference on Multimedia, Melbourne, Australia, 2024 【PDF】

138. Huiming Zheng, Wei Gao*, Zhuozhen Yu, Tiesong Zhao, Ge Li. ViewPCGC: View-Guided Learned Point Cloud Geometry Compression in Proceedings of the 32nd ACM International Conference on Multimedia, Melbourne VIC Australia, 2024 【PDF】

139. Liang Xie, Wei Gao. LearningPCC: A PyTorch Library for Learning-Based Point Cloud Compression Melbourne VIC Australia, Melbourne VIC Australia, 2024 【PDF】

140. Ziyan Luo, Boxin Shi, Haoliang Li, Renjie Wan. Imaging Interiors: An implicit solution to electromagnetic inverse scattering problems in Proceedings of European Conference on Computer Vision, Milan, Italy, 2024 【PDF】

141. Yuchen Hong, Haofeng Zhong, Shuchen Weng, Jinxiu Liang, Boxin Shi. L-DiffER: Single image reflection removal with language-based diffusion model in Proceedings of European Conference on Computer Vision, Milan, Italy, 2024 【PDF】

142. Siqi Yang, Zhaojun Huang, Yakun Chang, Bin Fan, Zhaofei Yu, Boxin Shi. Real-datadriven 2000 FPS color video from mosaicked chromatic spikes in Proceedings of European Conference on Computer Vision, Milan, Italy, 2024 【PDF】

143. Shikun Ban, Juling Fan, Wentao Zhu, Xiaoxuan Ma, Yu Qiao, Yizhou Wang. Real-time Holistic Robot Pose Estimation with Unknown States in Proceedings of European Conference on Computer Vision, Milan, Italy, 2024 【PDF】

144. Shihe Shen, Huachen Gao, Wangze Xu, Rui Peng, Luyang Tang,Kaiqiang Xiong, Jianbo Jiao, Ronggang Wang. Disentangled Generation and Aggregation for Robust Radiance Fields in Proceedings of The 18th European Conference on Computer Vision 2024, Milan, Italy, 2024 【PDF】

145. Shihe Shen, Huachen Gao, Wangze Xu, Rui Peng,Luyang Tang, Kaiqiang Xiong, Jianbo Jiao, Ronggang Wang. Disentangled Generation and Aggregation for Robust Radiance Fields，European Conference on Computer Vision in Proceedings of The 18th European Conference on Computer Vision 2024, Milan, Italy, 2024 【PDF】

146. Chenhao Zhang, Wei Gao. Learned Rate Control for Frame-Level Adaptive Neural Video Compression via Dynamic Neural Network in Proceedings of The 18th European Conference on Computer Vision 2024, Milan, Italy, 2024 【PDF】

147. Kehan Li , Yanbo Fan ,Yang Wu , Zhongqian Sun , Wei Yang , Xiangyang Ji , Li Yuan , Jie Chen. Learning Pseudo 3D Guidance for View-consistent Texturing with 2D Diffusion in Proceedings of The 18th European Conference on Computer Vision 2024, Milan, Italy, 2024 【PDF】

148. Peng Jin, Hao Li, Zesen Cheng, Kehan Li, Runyi Yu, Chang Liu, Xiangyang Ji, Li Yuan, Jie Chen. Local Action-Guided Motion Diffusion Model for Text-to-Motion Generation, European Conference on Computer Vision in Proceedings of The 18th European Conference on Computer Vision 2024, Milan, Italy, 2024 【PDF】

149. Wangze Xu, Huachen Gao, Shihe Shen, Rui Peng, Jianbo Jiao, Ronggang Wang. MVPGS: Excavating Multi-view Priors for Gaussian Splatting from Sparse Input Views in Proceedings of The 18th European Conference on Computer Vision 2024, Milan, Italy, 2024 【PDF】

150. Runyi Li, Xuhan Sheng, Weiqi Li, Jian Zhang. OmniSSR: Zero-shot Omnidirectional Image Super-Resolution using Stable Diffusion Model in Proceedings of The 18th European Conference on Computer Vision 2024, Milan, Italy, 2024 【PDF】

151. Qiran Zou , Shian Du , Yu Wang , Chang Liu , Yi Xu , Jie Chen , Xiangyang Ji. ParCo: Part-Coordinating Text-to-Motion Synthesis, European Conference on Computer Vision in Proceedings of The 18th European Conference on Computer Vision 2024, Milan, Italy, 2024 【PDF】

152. Ruyang Liu, Chen Li, Haoran Tang, YiXiao Ge,Ying Shan, Ge Li. ST-LLM: Large Language Models Are Effective Temporal Learners in Proceedings of The 18th European Conference on Computer Vision 2024, Milan, Italy, 2024 【PDF】

153. Rui Peng, Shihe Shen, Kaiqiang Xiong, Huachen Gao, Jianbo Jiao, Xiaodong Gu, Ronggang Wang. Surface-Centric Modeling for High-Fidelity Generalizable Neural Surface Reconstruction in Proceedings of The 18th European Conference on Computer Vision 2024, Milan, Italy, 2024 【PDF】

154. Mengjun Cheng, Chengquan Zhang , Chang Liu ,Yuke Li, Bohan Li, Kun Yao, Xiawu Zheng , Rongrong Ji , Jie Chen. Textual Grounding for Open-vocabulary Visual Information Extraction in Layout-Diversified Documents in Proceedings of The 18th European Conference on Computer Vision 2024, Milan, Italy, 2024 【PDF】

155. Yulin Luo, Ruichuan An, Bocheng Zou, Yiming Tang, Jiaming Liu, Shanghang Zhang. LLM as Dataset Analyst: Subpopulation Structure Discovery with Large Language Model in Proceedings of the European Conference on Computer Vision, Milan, Italia, 2024 【PDF】

156. Jiangxing Wang, Jiachen Li, Xiao Han, Deheng Ye, and Zongqing Lu. Language Model Adaption for Reinforcement Learning with Natural Language Action Space in Proceedings of Annual Meeting of the Association for Computational Linguistics, Bankok, Thailand, 2024 【PDF】

157. Quanmin Liang, Zhilin Huang, Xiawu Zheng, Feidiao Yang, Jun Peng, Kai Huang, Yonghong Tian. Efficient Event Stream Super-Resolution with Recursive Multi-Branch Fusion in Proceedings of International Joint Conference on Artificial Intelligence, Jeju, Korea, 2024 【PDF】

158. Ruohua Shi*, Zhaochen Liu*, Lingyu Duan, Tingting Jiang. Amodal Segmentation for Laparoscopic Surgery Video Instruments in Proceedings of the International Conference on Sensing and Imaging, Huangshan City, China, 2024 【PDF】

159. Jianhao Ding, Zhaofei Yu, Tiejun Huang, Jian K Liu. Enhancing the Robustness of Spiking Neural Networks with Stochastic Gating Mechanisms in Proceedings of Association for the Advancement of Artificial Intelligence, Vancouver, Canada, 2024 【PDF】

160. Junwei Zhao, Shiliang Zhang, Zhaofei Yu, Tiejun Huang. Recognizing Ultra-High-Speed Moving Objects with Bio-Inspired Spike Camera in Proceedings of Association for the Advancement of Artificial Intelligence, Vancouver, Canada, 2024 【PDF】

161. Jiyuan Zhang, Shiyan Chen, Yajing Zheng, Zhaofei Yu, Tiejun Huang. Transient Glimpses: Unveiling Occluded Backgrounds through the Spike Camera in Proceedings of Association for the Advancement of Artificial Intelligence, Vancouver, Canada, 2024 【PDF】

162. Rui Li, Yifan Wei, Haopeng Lu, Siwei Ma, Zhenyu Liu, Hui Liu, Qianying Wang, Yaqiang Wu, Jianrong Tan. Chinese Ancient Painting Figure Face Restoration and Its Application in a Q&A Interaction System in Proceedings of IEEE International Conference on Multimedia and Expo Workshops, Niagara Falls, Canada, pp.1-6, 2024 【PDF】

163. Haopeng Lu, Wenkang Shan, Yuhuai Zhang, Li Song, Xinfeng Zhang, Siwei Ma, Liuxin Zhang, Wen Gao. LFCAVE: Interactive 3D Space with Multiple Light Field Displays in Proceedings of IEEE International Conference on Multimedia and Expo Workshops, Niagara Falls, Canada, 2024 【PDF】

164. Wenkang Shan, Haopeng Lu, Chuanmin Jia, Xinfeng Zhang, Siwei Ma, Yaqiang Wu, & Wen Gao. Real-Time Human Motion Transfer System for Holographic Displays in Proceedings of IEEE International Conference on Multimedia and Expo Workshops, Niagara Falls, Canada, 2024 【PDF】

165. Yilin Guo，Ruoke Yan, Yaqiang Wu, Siwei Ma. Styleself: Style-Controllable High-Fidelity Conversational Virtual Avatars Generation in Proceedings of IEEE International Conference on Multimedia and Expo Workshops, Niagara Falls, Canada, 2024 【PDF】

166. Naifu Xue, Qi Mao, Zijian Wang, Yuan Zhang, Siwei Ma. Unifying Generation and Compression: Ultra-low bitrate Image Coding Via Multi-stage Transformer in Proceedings of IEEE International Conference on Multimedia and Expo Workshops, Niagara Falls, Canada, 2024 【PDF】

167. Pochun Chen, Nan Zhang, Guoqing Liu, Ge Li. MFITrack: Multi-Frame Integration Strategy for Enhanced Motion-Centric Single Object Tracking in Proceedings of 2024 IEEE International Conference on Multimedia and Expo, Niagara Falls, ON, Canada, 2024 【PDF】

168. Keli Wen, Nan Zhang, Ge Li, Wei Gao. MPVNN: Multi-resolution Point-Voxel Non-parametric Network for 3D Point Cloud Processing in Proceedings of 2024 IEEE International Conference on Multimedia and Expo, Niagara Falls, ON, Canada, 2024 【PDF】

169. Zhuangzi Li, Shan Liu, Ge Li. PointELM: Fast Point Cloud Classification Using Deep Random Mapping Based Extreme Learning Machines in Proceedings of 2024 IEEE International Conference on Multimedia and Expo, Niagara Falls, ON, Canada, 2024 【PDF】

170. Mingzhou Liu, Xinwei Sun, Yu Qiao, Yizhou Wang. Causal Discovery via Conditional Independence Testing with Proxy Variables in Proceedings of Forty-first International Conference on Machine Learning, Vienna, Austria, 2024 【PDF】

171. Long Ma, Yuanfei Wang, Fangwei Zhong, Song-Chun Zhu, Yizhou Wang. Fast Peer Adaptation with Context-aware Exploration in Proceedings of Forty-first International Conference on Machine Learning, Vienna, Austria, 2024 【PDF】

172. Wentao Zhu, Zhining Zhang, Yizhou Wang. Language Models Represent Beliefs of Self and Others in Proceedings of Forty-first International Conference on Machine Learning, Vienna, Austria, 2024 【PDF】

173. Rui Ma, Mengxi Guo, Peidong Jia, Chenxuan Li, Yi Hou, Yuan Li, Xiaodong Xie, Shanghang Zhang. Enhanced Blind Watermarking Against Black-Box Noise: Leveraging CIN Framework in Proceedings of IEEE International Conference on Multimedia and Expo, Niagara Falls, ON, Canada, 2024 【PDF】

174. Dongmei Zhang, Ray Zhang, Fan Yang, Yuan Li, Huizhu Jia, Xiaodong Xie. VLUReID: Exploiting Vision-Language Knowledge for Unsupervised Person Re-Identification in Proceedings of IEEE International Conference on Multimedia and Expo, Niagra Falls, Canada, 2024 【PDF】

175. Dongmei Zhang, Ray Zhang, Fan Yang, Yuan Li, Huizhu Jia, Xiaodong Xie, Shanghang Zhang. VLUReID: Exploiting Vision-Language Knowledge for Unsupervised Person Re-Identification in Proceedings of IEEE International Conference on Multimedia and Expo, Niagara Falls, ON, Canada, 2024 【PDF】

176. Jiafei Lyu, Chenjia Bai, Jing-Wen Yang, Zongqing Lu, and Xiu Li. Cross-Domain Policy Adaptation by Capturing Representation Mismatch in Proceedings of International Conference on Machine Learning, Vienna, Austria, 2024 【PDF】

177. Wanpeng Zhang, Yilin Li, Boyu Yang, and Zongqing Lu. Tackling Non-Stationarity in Reinforcement Learning via Causal-Origin Representation in Proceedings of International Conference on Machine Learning, Vienna, Austria, 2024 【PDF】

178. Lihao Wang, Zhaofei Yu. Autaptic Synaptic Circuit Enhances Spatio-temporal Predictive Learning of Spiking Neural Networks in Proceedings of International Conferenceon Machine Learning, Vienna, Austria, pp.1-16, 2024 【PDF】

179. Jianhao Ding, Zhiyu Pan, Yujia Liu, Zhaofei Yu, Tiejun Huang. Robust Stable Spiking Neural Networks in Proceedings of International Conferenceon Machine Learning, Vienna, Austria, 2024 【PDF】

180. Yan Zhong, Xingyu Wu, Li Zhang, Chenxi Yang and Tingting Jiang. Causal-IQA: Towards the Generalization of Image Quality Assessment Based on Causal Inference in Proceedings of the Forty-first International Conference on Machine Learning, Vienna, Austria, 2024 【PDF】

181. Rui Ma, Mengxi Guo, Peidong Jia, Chenxuan Li, Yi Hou, Yuan Li, Xiaodong Xie, Shanghang Zhang. Enhanced Blind Watermarking Against Black-Box Noise: Leveraging CIN Framework in Proceedings of the IEEE International Conference on Multimedia & Expo, Niagra Falls, Canada, 2024 【PDF】

182. Yijia Zhang, Lingran Zhao, Shijie Cao, Wenqiang Wang, Ting Cao, Fan Yang, Mao Yang, Shanghang Zhang, Ningyi Xu. Integer or Floating Point? New Outlooks for Low-Bit Quantization on Large Language Models in Proceedings of the IEEE International Conference on Multimedia & Expo, Niagra Falls, Canada, 2024 【PDF】

183. Dongmei Zhang, Shanghang Zhang, Ray Zhang, Fan Yang, Yuan Li, Huizhu Jia, Xiaodong Xie. VLUReID: Exploiting Vision-Language Knowledge for Unsupervised Person Re-Identification in Proceedings of the IEEE International Conference on Multimedia & Expo, Niagra Falls, Canada, 2024 【PDF】

184. Yixiong Zou, Shanghang Zhang, Haichen Zhou, Yuhua Li, Ruixuan Li. Compositional Few-Shot Class-Incremental Learning in Proceedings of the International Conference on Machine Learning, Vienna, Austria, 2024 【PDF】

185. Anthony Chen, Huanrui Yang, Yulu Gan, Denis A Gudovskiy, Zhen Dong, Haofan Wang, Tomoyuki Okuno, Yohei Nakata, Kurt Keutzer, Shanghang Zhang. Split-Ensemble: Efficient OOD-aware Ensemble via Task and Model Splitting in Proceedings of the International Conference on Machine Learning, Vienna, Austria, 2024 【PDF】

186. Pengying Wu, Yao Mu, Bingxian Wu, Yi Hou, Ji Ma, Shanghang Zhang, Chang Liu. VoroNav: Voronoi-based Zero-shot Object Navigation with Large Language Model in Proceedings of the International Conference on Machine Learning, Vienna, Austria, 2024 【PDF】

187. Yilin Guo; Jianhui Chang; Yuhuai Zhang; Jian Zhang; Siwei Ma. Image Encryption and Compression Based on Reversed Diffusion Model in Proceedings of Picture Coding Symposium, Taichung, Taiwan, 2024 【PDF】

188. Hongyue Huang, Xilong Zhou, Hongbo Ning, Haopeng Lu, Qi Zhang, Yanpeng Liang, Wanjun Lyu, ChuanminJia, Xinfeng Zhang, Liuxin Zhang, Siwei Ma. Low-Complexity 3D-Vision Conferencing System based on Accelerated RIFE Model in Proceedings of Picture Coding Symposium, Taichung, Taiwan, 2024 【PDF】

189. Ruyang Liu, Chen Li, Yixiao Ge, Thomas H. Li, Ying Shan, Ge Li. BT-Adapter: Video Conversation is Feasible Without Video Instruction Tuning in Proceedings of 2024 IEEE/CVF Conference on Computer Vision and Pattern Recognition, Seattle, WA, USA, pp.13658-13667, 2024 【PDF】

190. Yuyao Ye, Ning Zhang, Yang Zhao, Hongbin Cao, Ronggang Wang. Deep Video Inverse Tone Mapping Based on Temporal Clues in Proceedings of 2024 IEEE/CVF Conference on Computer Vision and Pattern Recognition, Seattle, WA, USA, 2024 【PDF】

191. Pengchong Qiao, Lei Shang, Chang Liu, Baigui Sun, Xiangyang Ji, Jie Chen. FaceChain-SuDe: Building Derived Class to Inherit Category Attributes for One-shot Subject-Driven Generation in Proceedings of 2024 IEEE/CVF Conference on Computer Vision and Pattern Recognition, Seattle, WA, USA, 2024 【PDF】

192. Yian Zhao, Kehan Li, Zesen Cheng, Pengchong Qiao, Chang Liu, Li Yuan, Xiawu Zheng, Rongrong Ji, Jie Chen. Fine-grained Simulation and Adaptation for Granularity-aware Interactive Segmentation in Proceedings of 2024 IEEE/CVF Conference on Computer Vision and Pattern Recognition, Seattle, WA, USA, 2024 【PDF】

193. Xiaoyun Zheng, Liwei Liao, Xufeng Li, Jianbo Jiao, Rongjie Wang, Feng Gao, Shiqi Wang, Ronggang Wang. PKU-DyMVHumans: A Multi-View Video Benchmark for High-Fidelity Dynamic Human Modeling in Proceedings of 2024 IEEE/CVF Conference on Computer Vision and Pattern Recognition, Seattle, WA, USA, 2024 【PDF】

194. Wanpeng Zhang and Zongqing Lu. AdaRefiner: Refining Decisions of Language Models with Adaptive Feedback in Proceedings of Annual Conference of the North American Chapter of the Association for Computational Linguistics, Mexico City, Mexico, 2024 【PDF】

195. Yicheng Feng, Yuxuan Wang, Jiazheng Liu, Sipeng Zheng, and Zongqing Lu. LLaMA Rider: Spurring Large Language Models to Explore the Open World in Proceedings of Annual Conference of the North American Chapter of the Association for Computational Linguistics, Mexico City, Mexico, 2024 【PDF】

196. Jianping Jiang, Xinyu Zhou, Bingxuan Wang, Xiaoming Deng, Chao Xu, Boxin Shi. Complementing event streams and RGB frames for hand mesh reconstruction in Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, Seattle, WA, USA, 2024 【PDF】

197. Yujia Liu*, Chenxi Yang*, Dingquan Li, Jianhao Ding, Tingting Jiang. Defense Against Adversarial Attacks on No-Reference Image Quality Models with Gradient Norm Regularization in Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, Seattle, WA, USA, 2024 【PDF】

198. Heng Guo, Jieji Ren, Feishi Wang, Boxin Shi, Mingjun Ren, Yasuyuki Matsushita. DiLiGenRT: A photometric stereo dataset with quantified roughness and translucency in Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, Seattle, WA, USA, 2024 【PDF】

199. Xinyu Zhou, Peiqi Duan, Boyu Li, Chu Zhou, Chao Xu, Boxin Shi. EvDiG: Event-guided direct and global components separation in Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, Seattle, WA, USA, 2024 【PDF】

200. Bohan Yu, Jieji Ren, Jin Han, Feishi Wang, Jinxiu Liang, Boxin Shi. EventPS: Realtime photometric stereo using an event camera in Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, Seattle, WA, USA, 2024 【PDF】

201. Haofeng Zhong, Yuchen Hong, Shuchen Weng, Jinxiu Liang, Boxin Shi. Language-guided image reflection separation in Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, Seattle, WA, USA, 2024 【PDF】

202. Yixin Yang, Jinxiu Liang, Bohan Yu, Yan Chen, Jimmy S. Ren, Boxin Shi. Latency correction for event-guided deblurring and frame interpolation in Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, Seattle, WA, USA, 2024 【PDF】

203. Yifei Xia, Chu Zhou, Chengxuan Zhu, Mingui Teng, Chao Xu, Boxin Shi. NB-GTR: Narrow-band guided turbulence removal in Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, Seattle, WA, USA, 2024 【PDF】

204. Yufei Han, Heng Guo, Koki Fukai, Hiroaki Santo, Boxin Shi, Fumio Okura, Zhanyu Ma, and Yunpeng Jia. NeRSP: Neural 3D reconstruction for reflective objects with sparse polarized images in Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, Seattle, WA, USA, 2024 【PDF】

205. Yunkai Tang, Chengxuan Zhu, Renjie Wan, Chao Xu, Boxin Shi. Neural underwater scene representation in Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, Seattle, WA, USA, 2024 【PDF】

206. Ziqi Cai, Kaiwen Jiang, Shu-Yu Chen, Yu-Kun Lai, Hongbo Fu, Boxin Shi, Lin Gao. Real-time 3D-aware portrait video relighting in Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, Seattle, WA, USA, 2024 【PDF】

207. Zongrui Li, Zhan Lu, Haojie Yan, Boxin Shi, Gang Pan, Qian Zheng, Xudong Jiang. Spin-UP: Spin light for natural Light uncalibrated photometric stereo in Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, Seattle, WA, USA, 2024 【PDF】

208. Yakun Chang, Yeliduosi Xiaokaiti, Yujia Liu, Bin Fan, Zhaojun Huang, Tiejun Huang, Boxin Shi. Towards HDR and HFR video from rolling-mixed-bit spikings in Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, Seattle, WA, USA, 2024 【PDF】

209. Fan Fei, Jiajun Tang, Ping Tan, Boxin Shi. VMINer: Versatile multi-view inverse rendering with near- and far-field light sources in Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, Seattle, WA, USA, 2024 【PDF】

210. Haoran Xu, Peixi Peng, Guang Tan, Yuan Li, Xinhai Xu, Yonghong Tian. DMR: Decomposed Multi-Modality Representations for Frames and Events Fusion in Visual Reinforcement Learning in Proceedings of IEEE/CVF Conference on Computer Vision and Pattern Recognition, Seattle WA, USA, 2024 【PDF】

211. Mengyue Geng, Lin Zhu, Lizhi Wang, Wei Zhang, Ruiqin Xiong, Yonghong Tian. Event-based Visible and Infrared Fusion via Multi-task Collaboration in Proceedings of IEEE/CVF Conference on Computer Vision and Pattern Recognition, Seattle WA, USA, 2024 【PDF】

212. Shiyan Chen, Jiyuan Zhang, Zhaofei Yu, Tiejun Huang. Exploring Efficient Asymmetric Blind-Spots for Self-Supervised Denoising in Real-World Scenarios in Proceedings of IEEE/CVF Conference on Computer Vision and Pattern Recognition, Seattle, USA, 2024 【PDF】

213. Changqing Su, Zhiyuan Ye, Yongsheng Xiao, You Zhou, Zhen Cheng, Bo Xiong, Zhaofei Yu, Tiejun Huang. Intensity-Robust Autofocus for Spike Camera in Proceedings of IEEE/CVF Conference on Computer Vision and Pattern Recognition, Seattle, USA, 2024 【PDF】

214. Zixuan Hu, Xiaotong Li, Shixiang Tang, Jun Liu, Yichun Hu, Ling-Yu Duan. LEAD: Exploring Logit Space Evolution for Model Selection in Proceedings of IEEE/CVF Conference on Computer Vision and Pattern Recognition, Seattle, WA, USA, pp.28664-28673, 2024 【PDF】

215. Dongkai Wang, Shiyu Xuan, Shiliang Zhang. LocLLM: Exploiting Generalizable Human Keypoint Localization via Large Language Model in Proceedings of IEEE/CVF Conference on Computer Vision and Pattern Recognition, Seattle, USA, pp.614-623, 2024 【PDF】

216. Zehong Ma, Shiliang Zhang, Longhui Wei, Qi Tian. OVMR: Open-Vocabulary Recognition with Multi-Modal References in Proceedings of IEEE/CVF Conference on Computer Vision and Pattern Recognition, Seattle, USA, pp.16571-16581, 2024 【PDF】

217. Shiyu Xuan, Qingpei Guo, Ming Yang, Shiliang Zhang. Pink: Unveiling the Power of Referential Comprehension for Multi-modal LLMs in Proceedings of IEEE/CVF Conference on Computer Vision and Pattern Recognition, Seattle, USA, pp.13838-13848, 2024 【PDF】

218. Yuan Xu, Xiaoxuan Ma, Jiajun Su, Wentao Zhu, Yu Qiao, Yizhou Wang. ScoreHypo: Probabilistic Human Mesh Estimation with Hypothesis Scoring in Proceedings of IEEE/CVF Conference on Computer Vision and Pattern Recognition, Seattle, USA, 2024 【PDF】

219. Xinzi Cao, Xiawu Zheng, Guanhong Wang, Weijiang Yu, Yunhang Shen, Ke Li, Yutong Lu, Yonghong Tian. Solving the Catastrophic Forgetting Problem in Generalized Category Discovery in Proceedings of IEEE/CVF Conference on Computer Vision and Pattern Recognition, Seattle WA, USA, 2024 【PDF】

220. Dongkai Wang, Shiliang Zhang. Spatial-Aware Regression for Keypoint Localization in Proceedings of IEEE/CVF Conference on Computer Vision and Pattern Recognition, Seattle, USA, pp.624-633, 2024 【PDF】

221. Jiyuan Zhang, Shiyan Chen, Yajing Zheng, Zhaofei Yu, Tiejun Huang. Spike-guided Motion Deblurring with Unknown Modal Spatiotemporal Alignment in Proceedings of IEEE/CVF Conference on Computer Vision and Pattern Recognition, Seattle, USA, 2024 【PDF】

222. Xinyu Shi, Zecheng Hao, Zhaofei Yu. SpikingResformer: Bridging ResNet and Vision Transformer in Spiking Neural Networks in Proceedings of IEEE/CVF Conference on Computer Vision and Pattern Recognition, Seattle, USA, 2024 【PDF】

223. Guanqun Wang, Jiaming Liu, Chenxuan Li, Yuan Zhang, Ma Junpeng, Xinyu Wei, Kevin Zhang, Maurice Chong, Renrui Zhang, Yijiang Liu, Shanghang Zhang. Cloud-Device Collaborative Learning for Multimodal Large Language Models in Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, Seattle,USA, 2024 【PDF】

224. Jiaming Liu, Ran Xu. Senqiao Yang. Renrui Zhang. Qizhe Zhang, Zehui Chen, Yandong Guo, Shanghang Zhang. Continual-MAE: Adaptive Distribution Masked Autoencoders for Continual Test-Time Adaptation in Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, Seattle,USA, 2024 【PDF】

225. Yuan Zhang, Tao Huang, Jiaming Liu, Tao Jiang, Kuan Cheng, Shanghang Zhang. FreeKD: Knowledge Distillation via Semantic Frequency Prompt in Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, Seattle,USA, 2024 【PDF】

226. Zhi Zhang, Qizhe Zhang, Zijun Gao, Renrui Zhang, Ekaterina Shutova, Shiji Zhou, Shanghang Zhang. Gradient-based Parameter Selection for Efficient Fine-Tuning in Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, Seattle,USA, 2024 【PDF】

227. Xiaobao Wei, Renrui Zhang, Jiarui Wu, Jiaming Liu, Ming Lu, Yandong Guo, Shanghang Zhang. NTO3D: Neural Target Object 3D Reconstruction with Segment Anything in Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, Seattle,USA, 2024 【PDF】

228. Junyi Yao, Yijiang Liu, Zhen Dong, Mingfei Guo, Helan Hu, Kurt Keutzer, Li Du, Daquan Zhou, Shanghang Zhang. PromptCoT: Align Prompt Distribution via Adapted Chain-of-Thought in Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, Seattle,USA, 2024 【PDF】

229. Xingqun Qi, Jiahao Pan, Peng Li, Ruibin Yuan, Xiaowei Chi, Mengfei Li, Wenhan Luo, Wei Xue, Shanghang Zhang, Qifeng Liu, Yike Guo. Weakly-Supervised Emotion Transition Learning for Diverse 3D Co-speech Gesture Generation in Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, Seattle,USA, 2024 【PDF】

230. Hongcheng Wang, Yuxuan Wang, Fangwei Zhong, Mingdong Wu, Jianwei Zhang, Yizhou Wang, Hao Dong. Learning Semantic-Agnostic and Spatial-Aware Representation for Generalizable Visual-Audio Navigation in Proceedings of 2024 IEEE International Conference on Robotics and Automation, Pacifico Yokohama, Japan, 2024 【PDF】

231. Zecheng Hao, Xinyu Shi, Zihan Huang, Tong Bu, Zhaofei Yu, Tiejun Huang. A Progressive Training Framework for Spiking Neural Networks with Learnable Multi-hierarchical Model in Proceedings of International Conference on Learning Representations, Vienna Austria, 2024 【PDF】

232. Jinyang Jiang, Zeliang Zhang, Chenliang Xu, Zhaofei Yu, Yijie Peng. One Forward is Enough for Neural Network Training via Likelihood Ratio Method in Proceedings of International Conference on Learning Representations, Vienna Austria, 2024 【PDF】

233. Yaoyu Zhu, Jianhao Ding, Tiejun Huang, Xiaodong Xie, Zhaofei Yu. Online Stabilization of Spiking Neural Networks in Proceedings of International Conference on Learning Representations, Vienna Austria, 2024 【PDF】

234. Zecheng Hao, Tong Bu, Xinyu Shi, Zihan Huang, Zhaofei Yu, Tiejun Huang. Threaten Spiking Neural Networks through Combining Rate and Temporal Information in Proceedings of International Conference on Learning Representations, Vienna Austria, 2024 【PDF】

235. Xinyu Shi, Jianhao Ding, Zecheng Hao, Zhaofei Yu. Towards Energy Efficient Spiking Neural Networks: An Unstructured Pruning Framework. in Proceedings of International Conference on Learning Representations, Vienna Austria, 2024 【PDF】

236. Kefan Su, Siyuan Zhou, Jiechuan Jiang, Chuang Gan, Xiangjun Wang, and Zongqing Lu. Multi-Agent Alternate Q-Learning in Proceedings of Kefan Su, Siyuan Zhou, Jiechuan Jiang, Chuang Gan, Xiangjun Wang, and Zongqing Lu, Auckland, New Zealand, 2024 【PDF】

237. Mengxi Zhang，heqing lian，Yiming Liu，Jie Chen. HARIS: Human-Like Attention for Reference Image Segmentation In Proceedings of the IEEE Conference on Multimedia Expo, Canada, 2024 【PDF】

238. Jiayi Ni, Senqiao Yang, Jiaming Liu, Xiaoqi Li, Wenyu Jiao, Ran Xu, Zehui Chen, Yi Liu, Shanghang Zhang. Distribution-Aware Continual Test Time Adaptation for Semantic Segmentation in Proceedings of the International Conference on Robotics and Automation, Yokohama, Japan, 2024 【PDF】

239. Jiaming Liu, Rongyu Zhang, Xiaoqi Li, Xiaowei Chi, Zehui Chen, Ming Lu, Yandong Guo, Shanghang Zhang. Multi-geometric Space Alignments for Domain Adaptive Multi-view 3D Object Detection in Proceedings of the International Conference on Robotics and Automation, Yokohama, Japan, 2024 【PDF】

240. Mingjie Pan, Jiaming Liu, Renrui Zhang, Peixiang Huang, Xiaoqi Li, Bing Wang, Hongwei Xie, Li Liu, Shanghang Zhang. RenderOcc: Vision-Centric 3D Occupancy Prediction with 2D Rendering Supervision in Proceedings of the International Conference on Robotics and Automation, Yokohama, Japan, 2024 【PDF】

241. Chi-Min Chan, Weize Chen, Yusheng Su, Jianxuan Yu, Wei Xue, Shanghang Zhang, Jie Fu, Zhiyuan Liu. ChatEval: Towards Better LLM-based Evaluators through Multi-Agent Debate in Proceedings of the Twelfth International Conference on Learning Representations, Vienna, Austria, 2024 【PDF】

242. Jiaming Liu, Senqiao Yang, Peidong Jia, Renrui Zhang, Ming Lu, Yandong Guo, Wei Xue, Shanghang Zhang. ViDA: Homeostatic Visual Domain Adapter for Continual Test Time Adaptation in Proceedings of the Twelfth International Conference on Learning Representations, Vienna, Austria, 2024 【PDF】

243. Rujie Wu, Xiaojian Ma, Zhenliang Zhang, Wei Wang, Qing Li, Song-Chun Zhu, Yizhou Wang. Bongard-OpenWorld: Few-Shot Reasoning for Free-form Visual Concepts in the Real World in Proceedings of Twelfth International Conference on Learning Representation, Vienna, Austria, 2024 【PDF】

244. Josef Dai, Xuehai Pan, Ruiyang Sun, Jiaming Ji, Xinbo Xu, Mickel Liu, Yizhou Wang, Yaodong Yang. Safe RLHF: Safe Reinforcement Learning from Human Feedback in Proceedings of Twelfth International Conference on Learning Representations, Vienna, Austria, 2024 【PDF】

245. Liuzhenghao Lv, Wei Fang, Li Yuan, Yonghong Tian. Optimal ANN-SNN Conversion with Group Neurons in Proceedings of IEEE International Conference on Acoustics, Speech and Signal Processing, Seoul, Korea, 2024 【PDF】

246. Haofeng Huang, Wenhan Yang, Lingyu Duan, Jiaying Liu. Seeing Dark Videos via Self-Learned Bottleneck Neural Representation in Proceeding of AAAI Conference on Artificial Intelligence, Vancouver, Canada, Vol.38, No.3, pp.2321-2329, 2024 【PDF】

247. Shiyu Xuan and Shiliang Zhang. Decoupled Contrastive Learning for Long-tailed Recognition in Proceedings of AAAI Conference on Artificial Intelligence, Vancouver, Canada, Vol.38, No.6, pp.6396-6403, 2024 【PDF】

248. Cong Cong, Shiyu Xuan, Sidong Liu, Shiliang Zhang, Maurice Pagnucco, Yang Song. Decoupled Optimisation for Long-tailed Visual Recognition in Proceedings of AAAI Conference on Artificial Intelligence, Vancouver, Canada, Vol.38, No.2, pp.1380-1388, 2024 【PDF】

249. Junwei Zhao, Shiliang Zhang, Zhaofei Yu, Tiejun Huang. Recognizing Ultra-High-Speed Moving Objects with Bio-inspired Spike Camera in Proceedings of AAAI Conference on Artificial Intelligence, Vancouver, Canada, Vol.38, No.7, pp.7478-7486, 2024 【PDF】

250. Yanchen Zhao, Wenxuan He, Chuanmin Jia, Qizhe Wang, Junru Li, Yue Li, Chaoyi Lin, Kai Zhang, Li Zhang, Siwei Ma. A Neural-network Enhanced Video Coding Framework beyond ECM in Proceedings of IEEE Data Compression Conference, Snowbird, UT, USA, pp.605-605, 2024 【PDF】

251. Qi Mao, Tinghan Yang, Yinuo Zhang, Zijian Wang, Meng Wang, Shiqi Wang, Libiao Jin, Siwei Ma. Extreme image compression using fine-tuned vqgans in Proceedings of IEEE Data Compression Conference, Snowbird, UT, USA, pp.203-212, 2024 【PDF】

252. Yian Zhao, Wenyu Lv, Shangliang Xu, Jinman Wei, Guanzhong Wang, Qingqing Dang, Yi Liu, Jie Chen,. DETRs Beat YOLOs on Real-time Object Detection In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, Seattle WA. USA, 2024 【PDF】

253. Guangyao Chen, Peixi Peng, Yangru Huang, and Mengyue Geng, Yonghong Tian. Adaptive Discovering and Merging for Incremental Novel Class Discovery in Proceedings of AAAI Conference on Artificial Intelligence, Vancouver, Canada, 2024 【PDF】

254. Yean Cheng, Renjie Wan, Shuchen Weng, Chengxuan Zhu, Yakun Chang, Boxin Shi. Colorizing monochromatic radiance fields in Proceedings of AAAI Conference on Artificial Intelligence, Vancouver, Canada, 2024 【PDF】

255. Yicheng Feng, Boshi An, and Zongqing Lu. Learning Multi-Object Positional Relationships via Emergent Communication in Proceedings of AAAI Conference on Artificial Intelligence, Vancuver, Canada, 2024 【PDF】

256. Zhan Lu, Qian Zheng, Boxin Shi, Xudong Jiang. Pano-NeRF: Synthesizing high dynamic range novel views with geometry from sparse low dynamic range panoramic images in Proceedings of AAAI Conference on Artificial Intelligence, Vancouver, Canada, 2024 【PDF】

257. Haobin Jiang, Ziluo Ding, and Zongqing Lu. Settling Decentralized Multi-Agent Coordinated Exploration by Novelty Sharing in Proceedings of AAAI Conference on Artificial Intelligence, Vancuver, Canada, 2024 【PDF】

258. Zhaochen Liu*, Zhixuan Li*, Tingting Jiang. BLADE: Box-Level Supervised Amodal Segmentation through Directed Expansion in Proceedings of the 38th Annual AAAI Conference on Artificial Intelligence, Vancouver, Canada, 2024 【PDF】

259. Ruohua Shi, Lingyu Duan, Tiejun Huang, Tingting Jiang. Evidential Uncertainty-guided Mitochondria Segmentation for 3D EM Images in Proceedings of the 38th Annual AAAI Conference on Artificial Intelligence, Vancouver, Canada, 2024 【PDF】

260. Ruohua Shi, Lingyu Duan, Tiejun Huang, Tingting Jiang. Evidential Uncertainty-guided Mitochondria Segmentation for 3D EM Images in Proceedings of the AAAI Conference on Artificial Intelligence, Vancouver, Canada, Vol.38, No.5, pp.4847-4855, 2024 【PDF】

261. Rongyu Zhang, Yulin Luo, Jiaming Liu, Huanrui Yang, Zhen Dong, Denis Gudovskiy, Tomoyuki Okuno, Yohei Nakata, Kurt Keutzer, Yuan Du, Shanghang Zhang. Efficient Deweahter Mixture-of-Experts with Uncertainty-Aware Feature-wise Linear Modulation in Proceedings of the Thirty-Eighth AAAI Conference on Artificial Intelligence, Vancouver, Canada, 2024 【PDF】

262. Senqiao Yang, Jiarui Wu, Jiaming Liu, Xiaoqi Li, Qizhe Zhang, Mingjie Pan, Yulu Gan, Zehui Chen, Shanghang Zhang. Exploring Sparse Visual Prompt for Domain Adaptive Dense Prediction in Proceedings of the Thirty-Eighth AAAI Conference on Artificial Intelligence, Vancouver, Canada, 2024 【PDF】

263. Dongmei Zhang, Chang Li, Ray Zhang, Shenghao Xie, Wei Xue, Xiaodong Xie, Shanghang Zhang. FM-OV3D: Foundation Model-based Cross-modal Knowledge Blending for Open-Vocabulary 3D Detection in Proceedings of the Thirty-Eighth AAAI Conference on Artificial Intelligence, Vancouver, Canada, 2024 【PDF】

264. Hongzhi Gao, Zheng Chen, Zehui Chen, Lin Chen, Jiaming Liu, Shanghang Zhang, Feng Zhao. Leveraging Imagery Data with Spatial Point Prior for Weakly Semi-Supervised 3D Object Detection in Proceedings of the Thirty-Eighth AAAI Conference on Artificial Intelligence, Vancouver, Canada, 2024 【PDF】

国内期刊 (Chinese Journal)

265. Ruonan Zhang, Xiaohang Liu.Ge Li, Thomas H. Li. Pengjun Zhao. Sketch-aided with Interactive Fusion Point Cloud Place Recognition ACM SIGMM International Conference on Multimedia Retrieva(ACM ICMR), 2024年7月【PDF】

266. Jiyuan Zhang, Yajing Zheng, Zhaofei Yu, Tiejun Huang. Spike-Based Vision for Autonomous Driving Scenarios Strategic Study of Chinese Academy of Engineering, Vol.26,pp.160-177, 2024年01月【PDF】

267. 李佳宁，王东凯，张史梁. 基于深度学习的二维人体姿态估计：现状及展望计算机学报, Vol.47,No.1,pp.231-250, 2024年01月【PDF】

视频与视觉技术国家工程研究中心NATIONAL ENGINEERING RESEARCH CENTER OF VISUAL TECHNOLOGY