Tags
第 1 頁
TRL
TRL:不是又一個微調工具,而是把 LLM 後訓練變成可重複工程流程的開源底座