最近朋友圈里有个词儿火得不行——大模型训练,甭管是科技媒体的头条,还是投资机构的报告,甚至咖啡厅里隔壁桌的闲聊,好像谁不聊两句“千亿参数”“万亿token”,就显得有点跟不上趟了,但说实话,刚开始听到...