Tags

第 3 頁

Fine-Tuning

TRL：不是又一個微調工具，而是把 LLM 後訓練變成可重複工程流程的開源底座

當 AI 團隊開始自己造資料，Distilabel 為什麼值得重新看

Unsloth 值得現在看嗎？微調門檻確實降下來了，但別因此以為每個團隊都該自己養模型