我把训练预料换成了自己准备的,大概10-40w条对话 但是跑完10000个step之后,发现loss在4-5之间。。。 有没有什么办法 谢谢
我把训练预料换成了自己准备的,大概10-40w条对话
但是跑完10000个step之后,发现loss在4-5之间。。。
有没有什么办法
谢谢