「veRLは最高のRLフレームワークであり、非常に効率的です」 ほんとですか。それは本当にですか。7B モデルを 8k コンテキストで調整するには、16 個の GPU が必要であることは確かですか。これには各ステップに19分かかるのが妥当だと思いますか