Meta 公開大模型架構 AU-Nets!

Meta 公開大模型架構 AU-Nets,這是一個基於自回歸 U-Nets 的語言建模,該 U-Net 在訓練過程中學習嵌入自身的分詞,改變傳統語言的分詞和處理模式。

AU-Net 是 Lingua 框架內的一個應用程式,可以像這樣的方式啟動它。

python -m lingua.stool script=apps.aunet.train config=apps/aunet/config/relevent_config.yaml nodes=<num_node> account=<slurm_account> qos=<slurm_qos>
 

https://arxiv.org/pdf/2506.14761

創作者介紹
創作者 KJPro Technology 部落格 的頭像
KJPro Technology

KJPro Technology 部落格

KJPro Technology 發表在 痞客邦 留言(0) 人氣( 0 )