4 21 3

Xinyin Ma

horseee

https://horseee.github.io/

horseee

AI & ML interests

None yet

Recent Activity

authored a paper 13 days ago

In-Video Instructions: Visual Signals as Generative Control

upvoted a paper 14 days ago

In-Video Instructions: Visual Signals as Generative Control

commented on a paper 14 days ago

In-Video Instructions: Visual Signals as Generative Control

View all activity

Organizations

upvoted a paper 14 days ago

In-Video Instructions: Visual Signals as Generative Control

Paper • 2511.19401 • Published 14 days ago • 29

upvoted a paper 20 days ago

MiroThinker: Pushing the Performance Boundaries of Open-Source Research Agents via Model, Context, and Interactive Scaling

Paper • 2511.11793 • Published 24 days ago • 158

upvoted a paper 2 months ago

SparseD: Sparse Attention for Diffusion Language Models

Paper • 2509.24014 • Published Sep 28 • 30

upvoted 2 papers 6 months ago

Drag-and-Drop LLMs: Zero-Shot Prompt-to-Weights

Paper • 2506.16406 • Published Jun 19 • 127

Discrete Diffusion in Large Language and Multimodal Models: A Survey

Paper • 2506.13759 • Published Jun 16 • 43

upvoted 5 papers 7 months ago

Can MLLMs Guide Me Home? A Benchmark Study on Fine-Grained Visual Reasoning from Transit Maps

Paper • 2505.18675 • Published May 24 • 25

VeriThinker: Learning to Verify Makes Reasoning Model Efficient

Paper • 2505.17941 • Published May 23 • 25

Dimple: Discrete Diffusion Multimodal Large Language Model with Parallel Decoding

Paper • 2505.16990 • Published May 22 • 22

dKV-Cache: The Cache for Diffusion Language Models

Paper • 2505.15781 • Published May 21 • 16

Thinkless: LLM Learns When to Think

Paper • 2505.13379 • Published May 19 • 50

upvoted 2 papers 10 months ago

Introducing Visual Perception Token into Multimodal Large Language Model

Paper • 2502.17425 • Published Feb 24 • 16

CoT-Valve: Length-Compressible Chain-of-Thought Tuning

Paper • 2502.09601 • Published Feb 13 • 14

upvoted 2 papers about 1 year ago

TinyFusion: Diffusion Transformers Learned Shallow

Paper • 2412.01199 • Published Dec 2, 2024 • 14

Collaborative Decoding Makes Visual Auto-Regressive Modeling Efficient

Paper • 2411.17787 • Published Nov 26, 2024 • 12

upvoted 3 papers over 1 year ago

upvoted a collection over 1 year ago

Nemotron 4 340B

Collection

Nemotron-4: open models for Synthetic Data Generation (SDG). Includes Base, Instruct, and Reward models. • 4 items • Updated 5 days ago • 162

upvoted a paper over 1 year ago

AsyncDiff: Parallelizing Diffusion Models by Asynchronous Denoising

Paper • 2406.06911 • Published Jun 11, 2024 • 12

upvoted a paper almost 2 years ago

MagicVideo-V2: Multi-Stage High-Aesthetic Video Generation

Paper • 2401.04468 • Published Jan 9, 2024 • 49

Xinyin Ma

AI & ML interests

Recent Activity

Organizations

horseee's activity