“再训练几轮?The results keep getting worse!(一次比一次效果差)再训练几次就要模型崩溃了!”
华泽成还没说话,强化学习组的组长杨子龙先不干了。
他是哈佛的本科,斯坦福的研究生,是个ABC,周文说的并不是很好,说起话来总是怪腔怪调的。
“这次的数据集是用橘子大模型清洗生成的,比传统数据还要干净,我检查过,洁净度比传统数据集还要高,应该不会有问题,是不是正则的问题?改一下正则策略呢?”
杜长庚很有些软,尤其不善于和人争辩,但事关自己的专业性,因此难得的争辩了几句。
“L2的策略能有什么问题?问题肯定在数据集上!”杨子龙气势汹汹的嚷嚷道。
杜长庚眉头一皱,正要说话,就看到方豫走进开放办公区。
看不见我看不见我看不见我。
一部分I人打开了鸵鸟模式。
其实他们中的大多数人都没被方豫骂过,但也不知道为什么,看到这个年轻的不像话的老板时,心里还是会有些发怵。
杜长庚就是其中之一,他比方豫足足大了七岁,但每次看到方豫的时候仍旧会有些紧张。
“这一次的数据集是用橘子大模型生成的?”方豫走了过来,扫了一眼显示器,手里握着鼠标滚了几圈。
“是用橘子大模型把数据过了一遍,去除了一部分污染比较严重的数据。”杜长庚尽量短的解释了一下。
方豫皱了皱眉,想了一下。
“用100M橘子大模型生成的图片数据训练一个3b的子模型,训练3轮,记录每一轮的训练效果。同时再做两组子模型的训练对比,一组用未清洗原始数据,另一组用第一个子模型生成的数据进行重复训练,同样记录每一轮的效果。”
“哦,好。”杜长庚嗯了一声,
杨子龙则两眼放光:“boss,马斯克呢?你不是去机场接他了吗?”
方豫一脸的莫名其妙:“我去机场接他干嘛?”
杨子龙大急:“那可是马斯克啊!IronMan,Dude, why aren’t you hyped?(哥们儿你怎么不兴奋)。”
“我看你倒是挺兴奋,要不你去机场接他?然后顺便就留在特斯拉,别回来了。”方豫神色不善的扫了杨子龙一眼。
“呃……”杨子龙挠了挠头,露出装傻的表情,“老板
本章未完,请点击下一页继续阅读!