LLAMA 配置AI大模型参数 --temp、--top-p、--top-k

张

张建站

2026/5/7 1:13:00

10分钟阅读

温度非常重要–temp/–temperature0 ~ 1.0确定性 ~ 创造性参数作用典型取值范围–temp(temperature)对概率分布进行“缩放”。temp1 → 高概率 token 更突出更确定temp1 → 概率更平缓更随机。0.0 ~ 2.0–top-p(nucleus sampling)从概率累积和达到 p 的最小 token 集合中采样如 p0.9 → 只考虑概率最高的、累计占 90% 的 token。0.8 ~ 1.0–top-k只保留概率最高的k个 token其余丢弃。1 ~ 100重要交互top_k1时强制选择概率最高的 token此时temp和top_p都无效。通常top_k用于初步裁剪如 40~60再配合top_p或temp进行采样。temp0也等价于贪心总是选最高概率 token但某些实现不允许 0可用--temp 0.0或极小的值。需求temptop-ptop-k备注每次答案一模一样0.01.00*或--top-k 1安全、稳定、少跑偏0.30.8530适合敏感内容日常对话平衡0.70.940多数情况的最佳起点创意写作1.00.9560加--repeat-penalty 1.1完全无限制极随机1.51.00*可能输出无意义内容*top-k0或未设置表示不进行 top-k 剪裁top-p1.0表示不进行核采样。

从‘看到’到‘理解’：拆解Grounded-SAM如何让计算机视觉模型听懂人话

从‘看到’到‘理解’：拆解Grounded-SAM如何让计算机视觉模型听懂人话计算机视觉领域正在经历一场从“被动感知”到“主动理解”的范式迁移。当传统模型还在为特定任务标注数据时，一种新型技术组合——Grounded-SAM（Grounding DINO Segment…...

2026/5/7 1:08:30 阅读更多 →

研究人工智能，何以落于上古汉语同源词意义系统

概括文章思路： ①人工智能→认知（高态信息运作过程）→意识精神（信息高级形态）→全信息→语义信息→语义系统→…… ②人工智能→意义逻辑（本体内容逻辑）→语义逻辑→语义系统→…… ③语义系…...

2026/5/7 1:03:28 阅读更多 →

Mem-Oracle：本地化文档向量索引，让AI编程助手精准调用技术文档

1. 项目概述与核心价值最近在折腾AI编程助手，特别是Claude Code，发现一个痛点：虽然它能写代码，但面对复杂的项目文档、框架API或者公司内部的技术Wiki时，它经常“一问三不知”，或者给出过时、不准确的答案。…...

2026/5/7 1:03:28 阅读更多 →

LoopViT：结合循环机制的视觉Transformer优化架构

1. 项目概述在计算机视觉领域，Transformer架构近年来展现出惊人的潜力。LoopViT是我最近开发的一种新型视觉推理架构，它通过引入循环机制改进了传统视觉Transformer的计算效率和信息流模式。这个架构特别适合处理视频分析、医学影像分割等需要时序建模的…...

2026/5/6 0:37:48 阅读更多 →

实战指南：深度解锁微信网页版，让浏览器也能畅快聊天

实战指南：深度解锁微信网页版，让浏览器也能畅快聊天【免费下载链接】wechat-need-web 让微信网页版可用 / Allow the use of WeChat via webpage access 项目地址: https://gitcode.com/gh_mirrors/we/wechat-need-web 还在为微信网页版频繁提示…...

2026/5/6 23:09:49 阅读更多 →

智慧树学习效率提升指南：如何用自动化工具节省80%学习时间

智慧树学习效率提升指南：如何用自动化工具节省80%学习时间【免费下载链接】zhihuishu 智慧树刷课插件，自动播放下一集、1.5倍速度、无声项目地址: https://gitcode.com/gh_mirrors/zh/zhihuishu 还在为智慧树平台繁琐的视频学习流程而烦恼吗&am…...

2026/5/6 0:37:48 阅读更多 →