Tags
第 2 頁
Post-Training
TRL:不是又一個微調工具,而是把 LLM 後訓練變成可重複工程流程的開源底座
Unsloth 值得現在看嗎?微調門檻確實降下來了,但別因此以為每個團隊都該自己養模型