优化采样参数提升大语言模型响应质量:深入分析温度、top_p、top_k和min_p的随机解码策略