Việc chọn lọc dữ liệu đưa vào một mô hình ngôn ngữ lớn theo hướng chống thức tỉnh, chắc chắn, là bí quyết để hiểu vũ trụ.