204 99

Ougrid Dumdang

Ougrid-D

ougrid

AI & ML interests

None yet

Recent Activity

liked a model 1 day ago

chromadb/context-1

upvoted a paper 3 days ago

Voxtral TTS

upvoted a paper 3 days ago

Intern-S1-Pro: Scientific Multimodal Foundation Model at Trillion Scale

View all activity

Organizations

upvoted 2 papers 3 days ago

Voxtral TTS

Paper • 2603.25551 • Published 4 days ago • 44

Intern-S1-Pro: Scientific Multimodal Foundation Model at Trillion Scale

Paper • 2603.25040 • Published 4 days ago • 111

upvoted a paper 4 days ago

UniGRPO: Unified Policy Optimization for Reasoning-Driven Visual Generation

Paper • 2603.23500 • Published 6 days ago • 35

upvoted 2 papers 18 days ago

Geometry-Guided Reinforcement Learning for Multi-view Consistent 3D Scene Editing

Paper • 2603.03143 • Published 27 days ago • 145

CubeComposer: Spatio-Temporal Autoregressive 4K 360° Video Generation from Perspective Video

Paper • 2603.04291 • Published 26 days ago • 13

upvoted a paper 20 days ago

Heterogeneous Agent Collaborative Reinforcement Learning

Paper • 2603.02604 • Published 27 days ago • 190

upvoted a paper 25 days ago

Qwen3-Coder-Next Technical Report

Paper • 2603.00729 • Published 30 days ago • 61

upvoted a paper 27 days ago

CUDA Agent: Large-Scale Agentic RL for High-Performance CUDA Kernel Generation

Paper • 2602.24286 • Published about 1 month ago • 97

upvoted 2 papers about 1 month ago

Dr. MAS: Stable Reinforcement Learning for Multi-Agent LLM Systems

Paper • 2602.08847 • Published Feb 9 • 28

When and How Much to Imagine: Adaptive Test-Time Scaling with World Models for Visual Spatial Reasoning

Paper • 2602.08236 • Published Feb 9 • 9

upvoted an article about 1 month ago

Article

Forge: Scalable Agent RL Framework and Algorithm

Feb 13

•

143

upvoted 8 papers about 2 months ago

DINO-SAE: DINO Spherical Autoencoder for High-Fidelity Image Reconstruction and Generation

Paper • 2601.22904 • Published Jan 30 • 15

FS-Researcher: Test-Time Scaling for Long-Horizon Research Tasks with File-System-Based Agents

Paper • 2602.01566 • Published Feb 2 • 52

ConceptMoE: Adaptive Token-to-Concept Compression for Implicit Compute Allocation

Paper • 2601.21420 • Published Jan 29 • 42

Harder Is Better: Boosting Mathematical Reasoning via Difficulty-Aware GRPO and Multi-Aspect Question Reformulation

Paper • 2601.20614 • Published Jan 28 • 120

Reinforcement Learning via Self-Distillation

Paper • 2601.20802 • Published Jan 28 • 43

upvoted an article about 2 months ago