Tags

第 2 頁

Post-Training

TRL：不是又一個微調工具，而是把 LLM 後訓練變成可重複工程流程的開源底座

Unsloth 值得現在看嗎？微調門檻確實降下來了，但別因此以為每個團隊都該自己養模型