Tags
第 3 頁
Fine-Tuning
TRL:不是又一個微調工具,而是把 LLM 後訓練變成可重複工程流程的開源底座
當 AI 團隊開始自己造資料,Distilabel 為什麼值得重新看
Unsloth 值得現在看嗎?微調門檻確實降下來了,但別因此以為每個團隊都該自己養模型