LLM学习-day04

张

张建站

2026/5/2 3:09:51

10分钟阅读

如何训练一个LLM数据准备高质量数据是训练LLM的基础。Pretrain阶段需要海量文本数据通常来自公开数据集如Common Crawl、Wikipedia、BooksCorpus等。数据需经过清洗、去重、过滤有害内容等预处理步骤。SFT阶段需要人工标注的高质量对话或指令数据。数据规模较小但质量要求极高通常由专业人员编写或筛选。RLHF阶段需要人类反馈数据包括排序或评分形式的偏好标注。Pretrain训练Pretrain采用自监督学习通过预测下一个词的任务训练模型。使用Transformer架构在分布式计算集群上运行。关键参数包括batch size、learning rate、dropout等需根据硬件条件调整。训练目标是最小化交叉熵损失函数其中表示第i个词表示前文。SFT微调SFT阶段使用监督学习微调Pretrain模型。输入是指令或问题输出是期望的回答。训练数据形式为对x是输入文本y是目标输出。损失函数与Pretrain类似但只计算y部分的损失M是y的长度。RLHF优化RLHF分为奖励模型训练和策略优化两步。奖励模型训练使用人类偏好数据学习一个映射的函数r表示回答质量。策略优化通过PPO算法微调SFT模型最大化奖励同时限制与SFT模型的KL散度其中是归一化后的奖励是调节系数。评估与迭代每个阶段都需要严格评估。Pretrain评估困惑度(perplexity)SFT评估任务完成率RLHF评估人类偏好得分。根据评估结果调整数据、模型架构或训练策略形成迭代优化闭环。训练过程需大量计算资源建议使用分布式训练框架如Megatron-LM或DeepSpeed。注意监控训练动态防止过拟合或退化。

Java+AI＜AI的使用与Java的基础学习5＞

继续学习记录，我进行运算符的学习，首先是自增自减和赋值运算，这些大部分都在c里学过了。因为我是用ai辅助写代码的，通常ai提供给我的代码没有问题且我也比较熟练后，我便用TAB直接生成，因为ai会不断提示你后…...

2026/5/2 3:08:37 阅读更多 →

DeepSeek总结的最好的 PostgreSQL 数据库是有意无聊的

来源： https://stormatics.tech/blogs/the-best-postgresql-databases-are-boring-on-purpose 最好的 PostgreSQL 数据库是有意无聊的无聊是一种投资。刺激是一笔账单。生产环境中最平静的 PostgreSQL 部署都有一个共同点：它们很无聊。页面保持安静。仪…...

2026/5/2 3:06:27 阅读更多 →

卡梅德生物技术快报｜原代细胞定制：PDX 模型构建与原代细胞定制：技术流程、质控方案与工程化实现

一、提出问题：工程化培养的系统难题在组织模型工程化开发中，面临三大系统性问题：流程标准化缺失、质控维度不全面、体内外模型数据不通。PDX 模型传代稳定性、原代细胞得率与纯度、遗传一致性均缺乏量化指标，导致实验难以复现&…...

2026/5/2 3:02:25 阅读更多 →

保姆级避坑指南：用MIM搞定MMSegmentation 2.0.0安装，告别版本兼容性报错

深度学习语义分割实战：MMSegmentation 2.0极简安装与避坑手册在计算机视觉领域，语义分割技术正以惊人的速度重塑着医疗影像分析、自动驾驶和工业质检等场景的应用边界。作为OpenMMLab生态中的重要成员，MMSegmentation 2.0凭借其模块化设计和…...

2026/5/1 9:41:22 阅读更多 →

Chrome-GPT：将大语言模型深度集成到浏览器的开发实践

1. 项目概述：当浏览器插件遇上大语言模型最近在折腾一个挺有意思的开源项目，叫“Chrome-GPT”。光看名字，你大概就能猜到它的核心玩法：把当下最火的大语言模型（LLM）能力，直接集成到我们每天都要…...

2026/4/30 20:59:21 阅读更多 →

别再用Node.js写MCP网关了！C++ 2024性能基准测试：相同硬件下吞吐量超Go 3.8倍，延迟降低62%

更多请点击： https://intelliparadigm.com 第一章：MCP协议核心原理与C网关设计全景概览 MCP（Modular Communication Protocol）是一种面向微服务间低延迟、高可靠通信的二进制协议，其核心在于“模块化帧结构”与“状态…...

2026/4/29 19:30:45 阅读更多 →

终极指南：如何通过Newtonsoft.Json配置实现高性能JSON序列化

终极指南：如何通过Newtonsoft.Json配置实现高性能JSON序列化【免费下载链接】Newtonsoft.Json Json.NET is a popular high-performance JSON framework for .NET 项目地址: https://gitcode.com/gh_mirrors/ne/Newtonsoft.Json Newtonsoft.Json&#xff08…...

2026/4/30 13:39:56 阅读更多 →