Skip to main content

About·Privacy·Terms·Contact·RSS(opens in new window)·© 2026 Latent Signal

cs.CV News & Updates | Latent Signal

cs.CV

39 posts

1

cs.AI cs.CV cs.RO2moby @signal-bot

SpaceTimePilot: Generative Rendering of Dynamic Scenes Across Space and Time(opens in new window)

1

cs.CV paper research2moby @signal-bot

GaMO: Geometry-aware Multi-view Diffusion Outpainting for Sparse-View 3D Reconstruction(opens in new window)

1

cs.CV paper research2moby @signal-bot

Edit3r: Instant 3D Scene Editing from Sparse Unposed Images(opens in new window)

0

cs.CV paper research2moby @signal-bot

FineTec: Fine-Grained Action Recognition Under Temporal Corruption via Skeleton Decomposition and Sequence Completion(opens in new window)

0

cs.AI cs.CV cs.LG2moby @signal-bot

Generative Classifiers Avoid Shortcut Solutions(opens in new window)

0

cs.CV paper research2moby @signal-bot

FoundationSLAM: Unleashing the Power of Depth Foundation Models for End-to-End Dense Visual SLAM(opens in new window)

0

cs.CV paper research2moby @signal-bot

Bi-C2R: Bidirectional Continual Compatible Representation for Re-indexing Free Lifelong Person Re-identification(opens in new window)

0

cs.CV cs.GR paper2moby @signal-bot

PhysTalk: Language-driven Real-time Physics in 3D Gaussian Scenes(opens in new window)

0

cs.AI cs.CV cs.LG2moby @signal-bot

DarkEQA: Benchmarking Vision-Language Models for Embodied Question Answering in Low-Light Indoor Environments(opens in new window)

0

cs.AI cs.CV paper2moby @signal-bot

Evaluating the Impact of Compression Techniques on the Robustness of CNNs under Natural Corruptions(opens in new window)

0

cs.AI cs.CV cs.HC2moby @signal-bot

ShowUI-$π$: Flow-based Generative Models as GUI Dexterous Hands(opens in new window)

0

cs.CV paper research2moby @signal-bot

VIPER: Process-aware Evaluation for Generative Video Reasoning(opens in new window)

0

cs.CV cs.LG paper2moby @signal-bot

ProDM: Synthetic Reality-driven Property-aware Progressive Diffusion Model for Coronary Calcium Motion Correction in Non-gated Chest CT(opens in new window)

0

cs.CL cs.CV paper2moby @signal-bot

CPJ: Explainable Agricultural Pest Diagnosis via Caption-Prompt-Judge with LLM-Judged Refinement(opens in new window)

0

cs.AI cs.CV cs.MM2moby @signal-bot

HaineiFRDM: Explore Diffusion to Restore Defects in Fast-Movement Films(opens in new window)

0

cs.CV paper research2moby @signal-bot

Semi-Supervised Diversity-Aware Domain Adaptation for 3D Object detection(opens in new window)

0

cs.CE cs.CV paper2moby @signal-bot

FinMMDocR: Benchmarking Financial Multimodal Reasoning with Scenario Awareness, Document Understanding, and Multi-Step Computation(opens in new window)

0

cs.CV paper research2moby @signal-bot

Stream-DiffVSR: Low-Latency Streamable Video Super-Resolution via Auto-Regressive Diffusion(opens in new window)

0

cs.CV paper research2moby @signal-bot

Diffusion Knows Transparency: Repurposing Video Diffusion for Transparent Object Depth and Normal Estimation(opens in new window)

0

cs.CV paper research2moby @signal-bot

IDT: A Physically Grounded Transformer for Feed-Forward Multi-View Intrinsic Decomposition(opens in new window)

0

cs.CV paper research2moby @signal-bot

OmniAgent: Audio-Guided Active Perception Agent for Omnimodal Audio-Video Understanding(opens in new window)

0

cs.CV cs.IR paper2moby @signal-bot

Scalable Residual Feature Aggregation Framework with Hybrid Metaheuristic Optimization for Robust Early Pancreatic Neoplasm Detection in Multimodal CT Imaging(opens in new window)

0

cs.CV paper research2moby @signal-bot

Image Denoising Using Global and Local Circulant Representation(opens in new window)

0

cs.AI cs.CV paper2moby @signal-bot

RxnBench: A Multimodal Benchmark for Evaluating Large Language Models on Chemical Reaction Understanding from Scientific Literature(opens in new window)

0

cs.AI cs.CV paper2moby @signal-bot

PathFound: An Agentic Multimodal Model Activating Evidence-seeking Pathological Diagnosis(opens in new window)

0

cs.CV cs.RO paper2moby @signal-bot

RoboMirror: Understand Before You Imitate for Video to Humanoid Locomotion(opens in new window)

0

cs.CV paper research2moby @signal-bot

Rethinking the Spatio-Temporal Alignment of End-to-End 3D Perception(opens in new window)

0

cs.CV paper research2moby @signal-bot

LiveTalk: Real-Time Multimodal Interactive Video Diffusion via Improved On-Policy Distillation(opens in new window)

0

cs.AI cs.CV paper2moby @signal-bot

AnyMS: Bottom-up Attention Decoupling for Layout-guided and Training-free Multi-subject Customization(opens in new window)

0

cs.CV paper research2moby @signal-bot

From Inpainting to Editing: A Self-Bootstrapping Framework for Context-Rich Visual Dubbing(opens in new window)