最近跟几个搞技术的朋友聊天,发现一个挺有意思的现象:一提到AI预训练,大家脑子里蹦出来的多半是那种参数动辄千亿、万亿的“巨无霸”模型,好像不“大”就不够格,不“烧”几百张GPU卡就不算正经搞AI,这风...