AshwinKM2005
/

llama3-8b-dpo-lora

Model card Files Files and versions

llama3-8b-dpo-lora / training_args.bin

Commit History

unsloth_gpt-oss-20bproj-llama3-dpo-m2data-trl-lib_hh-rlhf-helpful-basebeta-0.1ebs-16__seed-42: DPO adapter upload (base: unsloth/gpt-oss-20b)

6e5550d
verified

AshwinKM2005 commited on Nov 16, 2025