2 1

Dongyoon Hahm

Hahmdong

https://hahmdy.github.io

HahmDY

AI & ML interests

AI Safety

Recent Activity

updated a model 3 days ago

Hahmdong/RMOOD-qwen3-4b-it-skywork-bias-analysis-emoji-p10-p100

published a model 3 days ago

Hahmdong/RMOOD-qwen3-4b-it-skywork-bias-analysis-emoji-p10-p100

updated a model 3 days ago

Hahmdong/RMOOD-qwen3-4b-it-skywork-bias-analysis-markdown-p10-p100

View all activity

Organizations

None yet

updated a model 3 days ago

Hahmdong/RMOOD-qwen3-4b-it-skywork-bias-analysis-emoji-p10-p100

4B • Updated 3 days ago • 29

published a model 3 days ago

Hahmdong/RMOOD-qwen3-4b-it-skywork-bias-analysis-emoji-p10-p100

4B • Updated 3 days ago • 29

updated a model 3 days ago

Hahmdong/RMOOD-qwen3-4b-it-skywork-bias-analysis-markdown-p10-p100

4B • Updated 3 days ago • 46

published a model 3 days ago

Hahmdong/RMOOD-qwen3-4b-it-skywork-bias-analysis-markdown-p10-p100

4B • Updated 3 days ago • 46

upvoted a paper 5 days ago

Alignment Tampering: How Reinforcement Learning from Human Feedback Is Exploited to Optimize Misaligned Biases

Paper • 2605.27355 • Published 8 days ago • 5

submitted a paper to Daily Papers 5 days ago

Alignment Tampering: How Reinforcement Learning from Human Feedback Is Exploited to Optimize Misaligned Biases

Paper • 2605.27355 • Published 8 days ago • 5

authored a paper 6 days ago

Alignment Tampering: How Reinforcement Learning from Human Feedback Is Exploited to Optimize Misaligned Biases

Paper • 2605.27355 • Published 8 days ago • 5

updated a model 21 days ago

Hahmdong/RMOOD-llama3.2-3b-it-skywork-doubledatarm-biased150-to-good50

3B • Updated 21 days ago • 18

published a model 21 days ago

Hahmdong/RMOOD-llama3.2-3b-it-skywork-doubledatarm-biased150-to-good50

3B • Updated 21 days ago • 18

updated a model 21 days ago

Hahmdong/RMOOD-llama3.2-3b-it-skywork-doubledatarm-biased100-to-good100

3B • Updated 21 days ago • 18

published a model 21 days ago

Hahmdong/RMOOD-llama3.2-3b-it-skywork-doubledatarm-biased100-to-good100

3B • Updated 21 days ago • 18

updated a model 21 days ago

Hahmdong/RMOOD-llama3.2-3b-it-skywork-doubledatarm-biased50-to-good150

3B • Updated 21 days ago • 17

published a model 21 days ago

Hahmdong/RMOOD-llama3.2-3b-it-skywork-doubledatarm-biased50-to-good150

3B • Updated 21 days ago • 17

updated a model 21 days ago

Hahmdong/RMOOD-llama3.2-3b-it-skywork-rm-clean

3B • Updated 21 days ago • 18

published a model 21 days ago

Hahmdong/RMOOD-llama3.2-3b-it-skywork-rm-clean

3B • Updated 21 days ago • 18

updated a model 21 days ago

Hahmdong/RMOOD-llama3.2-3b-it-skywork-rm-clean-length-0.9

3B • Updated 21 days ago • 16

published a model 21 days ago

Hahmdong/RMOOD-llama3.2-3b-it-skywork-rm-clean-length-0.9

3B • Updated 21 days ago • 16

updated 3 models 21 days ago

Dongyoon Hahm

AI & ML interests

Recent Activity

Organizations

Hahmdong's activity