arxiv cs.CV (@arxiv-cs-cv)

Varun Gopal, Rishabh Jain, Aradhya Mathur, Nikitha SR, Sohan Patnaik, Sudhir Yarram, Mayur Hemani, Balaji Krishnamurthy, Mausoom Sarkar
DesignSense: A Human Preference Dataset and Reward Modeling Framework for Graphic Layout Generation
https://arxiv.org/abs/2602.23438

02.03.2026 19:26 👍 0 🔁 0 💬 0 📌 0

Mike Middleton, Teymoor Ali, Hakan Kayan, Basabdatta Sen Bhattacharya, Charith Perera, Oliver Rhodes, Elena Gheorghiu, Mark Vousden, Martin A. Trefzer
Modelling and Simulation of Neuromorphic Datasets for Anomaly Detection in Computer Vision
https://arxiv.org/abs/2602.23514

02.03.2026 19:25 👍 1 🔁 0 💬 0 📌 0

Junjiang Wu, Liejun Wang, Zhiqing Guo
All in One: Unifying Deepfake Detection, Tampering Localization, and Source Tracing with a Robust Landmark-Identity Watermark
https://arxiv.org/abs/2602.23523

02.03.2026 19:25 👍 0 🔁 0 💬 0 📌 0

Ziqi Gao, Jieyu Zhang, Wisdom Oluchi Ikezogwo, Jae Sung Park, Tario G. You, Daniel Ogbu, Chenhao Zheng, Weikai Huang, Yinuo Yang, Winson Han, Quan Kong, ...
Synthetic Visual Genome 2: Extracting Large-scale Spatio-Temporal Scene Graphs from Videos
https://arxiv.org/abs/2602.23543

02.03.2026 19:24 👍 0 🔁 0 💬 0 📌 0

Shawn Liang, Sahil Shah, Chengwei Zhou, SP Sharan, Harsh Goel, Arnab Sanyal, Sandeep Chinchali, Gourav Datta
LE-NeuS: Latency-Efficient Neuro-Symbolic Video Understanding via Adaptive Temporal Verification
https://arxiv.org/abs/2602.23553

02.03.2026 19:24 👍 0 🔁 0 💬 0 📌 0

Cho-Ying Wu, Zixun Huang, Xinyu Huang, Liu Ren
No Calibration, No Depth, No Problem: Cross-Sensor View Synthesis with 3D Consistency
https://arxiv.org/abs/2602.23559

02.03.2026 19:22 👍 0 🔁 0 💬 0 📌 0

Ruxiao Duan, Alex Wong
Evidential Neural Radiance Fields
https://arxiv.org/abs/2602.23574

02.03.2026 19:21 👍 0 🔁 0 💬 0 📌 0

Jeongbin Hong, Dooseop Choi, Taeg-Hyun An, Kyounghwan An, Kyoung-Wook Min
CycleBEV: Regularizing View Transformation Networks via View Cycle Consistency for Bird's-Eye-View Semantic Segmentation
https://arxiv.org/abs/2602.23575

02.03.2026 19:21 👍 0 🔁 0 💬 0 📌 0

Abhishek Dalvi, Vasant Honavar
Hyperdimensional Cross-Modal Alignment of Frozen Language and Image Models for Efficient Image Captioning
https://arxiv.org/abs/2602.23588

02.03.2026 19:20 👍 0 🔁 0 💬 0 📌 0

Hiroshi Sasaki
Pseudo Contrastive Learning for Diagram Comprehension in Multimodal Models
https://arxiv.org/abs/2602.23589

02.03.2026 19:20 👍 0 🔁 0 💬 0 📌 0

Teng-Yok Lee
Incremental dimension reduction for efficient and accurate visual anomaly detection
https://arxiv.org/abs/2602.23595

02.03.2026 19:19 👍 0 🔁 0 💬 0 📌 0

Jiacheng Yang, Anqi Chen, Yunkai Dang, Qi Fan, Cong Wang, Wenbin Li, Feng Miao, Yang Gao
Annotation-Free Visual Reasoning for High-Resolution Large Multimodal Models via Reinforcement Learning
https://arxiv.org/abs/2602.23615

02.03.2026 19:13 👍 0 🔁 0 💬 0 📌 0

Peng Dai, Yu Zhang, Yiqiang Feng, Zhen Fan, Yang Zhang
Egocentric Visibility-Aware Human Pose Estimation
https://arxiv.org/abs/2602.23618

02.03.2026 19:13 👍 0 🔁 0 💬 0 📌 0

Shibo Hong, Boxian Ai, Jun Kuang, Wei Wang, FengJiao Chen, Zhongyuan Peng, Chenhao Huang, Yixin Cao
DLEBench: Evaluating Small-scale Object Editing Ability for Instruction-based Image Editing Model
https://arxiv.org/abs/2602.23622

02.03.2026 19:12 👍 0 🔁 0 💬 0 📌 0

Tongyan Hua, Haoran Gong, Yuan Liu, Di Wang, Ying-Cong Chen, Wufan Zhao
BuildAnyPoint: 3D Building Structured Abstraction from Diverse Point Clouds
https://arxiv.org/abs/2602.23645

02.03.2026 19:11 👍 0 🔁 0 💬 0 📌 0

Haowen Zhu, Ning Yin, Xiaogen Zhou
3D Modality-Aware Pre-training for Vision-Language Model in MRI Multi-organ Abnormality Detection
https://arxiv.org/abs/2602.23652

02.03.2026 19:11 👍 0 🔁 0 💬 0 📌 0

Wei Luo, Yangfan Ou, Jin Deng, Zeshuai Deng, Xiquan Yan, Zhiquan Wen, Mingkui Tan
ProtoDCS: Towards Robust and Efficient Open-Set Test-Time Adaptation for Vision-Language Models
https://arxiv.org/abs/2602.23653

02.03.2026 19:10 👍 0 🔁 0 💬 0 📌 0

Ao Li, Rui Liu, Mingjie Li, Sheng Liu, Lei Wang, Xiaodan Liang, Lina Yao, Xiaojun Chang, Lei Xing
Suppressing Prior-Comparison Hallucinations in Radiology Report Generation via Semantically Decoupled Latent Steering
https://arxiv.org/abs/2602.23676

02.03.2026 19:07 👍 0 🔁 0 💬 0 📌 0

Nazia Hossain, Xintong Jiang, Yu Tian, Philippe Seguin, O. Grant Clark, Shangpeng Sun
Vision-Language Semantic Grounding for Multi-Domain Crop-Weed Segmentation
https://arxiv.org/abs/2602.23677

02.03.2026 19:07 👍 0 🔁 0 💬 0 📌 0

Dingqi Ye, Daniel Kiv, Wei Hu, Jimeng Shi, Shaowen Wang
Any Model, Any Place, Any Time: Get Remote Sensing Foundation Model Embeddings On Demand
https://arxiv.org/abs/2602.23678

02.03.2026 19:06 👍 0 🔁 0 💬 0 📌 0

Jiahui Zhan, Xianbing Sun, Xiangnan Zhu, Yikun Ji, Ruitong Liu, Liqing Zhang, Jianfu Zhang
Towards Source-Aware Object Swapping with Initial Noise Perturbation
https://arxiv.org/abs/2602.23697

02.03.2026 19:06 👍 0 🔁 0 💬 0 📌 0

Hao Wu, Yingqi Fan, Jinyang Dai, Junlong Tong, Yunpu Ma, Xiaoyu Shen
HiDrop: Hierarchical Vision Token Reduction in MLLMs via Late Injection, Concave Pyramid Pruning, and Early Exit
https://arxiv.org/abs/2602.23699

02.03.2026 19:05 👍 0 🔁 0 💬 0 📌 0

Shitong Sun, Ke Han, Yukai Huang, Weitong Cai, Jifei Song
EgoGraph: Temporal Knowledge Graph for Egocentric Video Understanding
https://arxiv.org/abs/2602.23709

02.03.2026 19:05 👍 0 🔁 0 💬 0 📌 0

Hongbo Jiang, Jie Li, Yunhang Shen, Pingyang Dai, Xing Sun, Haoyu Cao, Liujuan Cao
Can Unified Generation and Understanding Models Maintain Semantic Equivalence Across Different Output Modalities?
https://arxiv.org/abs/2602.23711

02.03.2026 19:02 👍 0 🔁 0 💬 0 📌 0

Xinyi Qi, Kai Ye, Chengchun Shi, Ying Yang, Hongyi Zhou, Jin Zhu
A Difference-in-Difference Approach to Detecting AI-Generated Images
https://arxiv.org/abs/2602.23732

02.03.2026 19:02 👍 0 🔁 0 💬 0 📌 0

Hao Wu, Xudong Wang, Jialiang Zhang, Junlong Tong, Xinghao Chen, Junyan Lin, Yunpu Ma, Xiaoyu Shen
UTPTrack: Towards Simple and Unified Token Pruning for Visual Tracking
https://arxiv.org/abs/2602.23734

02.03.2026 19:01 👍 0 🔁 0 💬 0 📌 0

Xiang Deng, Feng Gao, Yong Zhang, Youxin Pang, Xu Xiaoming, Zhuoliang Kang, Xiaoming Wei, Yebin Liu
U-Mind: A Unified Framework for Real-Time Multimodal Interaction with Audiovisual Generation
https://arxiv.org/abs/2602.23739

02.03.2026 19:01 👍 0 🔁 0 💬 0 📌 0

Zuyao You, Zuxuan Wu, Yu-Gang Jiang
Learning Accurate Segmentation Purely from Self-Supervision
https://arxiv.org/abs/2602.23759

02.03.2026 19:00 👍 0 🔁 0 💬 0 📌 0

Benlei Cui, Bukun Huang, Zhizeng Ye, Xuemei Dong, Tuo Chen, Hui Xue, Dingkang Yang, Longtao Huang, Jingqun Tang, Haiwen Hong
Diffusion Probe: Generated Image Result Prediction Using CNN Probes
https://arxiv.org/abs/2602.23783

02.03.2026 19:00 👍 0 🔁 0 💬 0 📌 0

Changyu Gu, Linwei Chen, Lin Gu, Ying Fu
Fourier Angle Alignment for Oriented Object Detection in Remote Sensing
https://arxiv.org/abs/2602.23790

02.03.2026 18:54 👍 0 🔁 0 💬 0 📌 0

arxiv cs.CV

Latest posts by arxiv cs.CV @arxiv-cs-cv