【星海出品】大模型微调-Part-One

张

张建站

2026/6/2 9:02:04

10分钟阅读

LoRA (Low-Rank Adaptation of Large Language Model)大规模语言模型的低秩适应低秩: 指矩阵的秩远小于其行数和列数意味着数据中存在大量冗余信息。NLA - 自然语言自编码器Natural Language Autoencoder(s)DeepSeek-Flash即DeepSeek-V4-Flash的总参数量为2840亿284B但在实际推理时只会激活约130亿13B的参数LLaMA-FactoryUnsloth Pro LoRA-XT QLoRAHuggingFace生态: https://huggingface.co/阿里巴巴达摩院提出的魔塔社区 https://modelscope.cn行业有人称其为中国版的HuggingFaceLLaMA-Factory: https://github.com/hiyouga/LLaMA-FactoryUnsloth: https://github.com/unslothai/unsloth适用 RTX 5080使用的5080 16G显存甜点级大模型文本生成模型8B-13B级别如Llama 3 8B/13B、Qwen2.5 14B全精度模型对比ollama提供的cloud 模型速度比本地速度快出一小截可能涉及到本地调整的参数与云上不同以及云传的网络过滤延迟等。

大模型Agent的 Meta-Skill（元技能）

在当今人工智能技术飞速发展的浪潮中，大语言模型（LLM）的能力已经从单纯的文本生成进化到了复杂的逻辑推理与任务执行。然而，随着应用场景的日益复杂，单一模型的局限性逐渐暴露，多智能体协作成为了新的技术高…...

2026/6/2 9:02:03 阅读更多 →

TS72250K，拥有10W峰值功率，稳守0.35dB极低损耗的射频开关

简介今天我要向大家介绍的是 Tagore 的射频开关——TS72250K。它拥有从10MHz到6GHz的极宽工作频率，这使得它像一个不知疲倦的旅行者，能够从容穿梭于特高频到超高频的广阔频段。正因为这种宽频天赋，它被广泛邀请到各种关键的通信场景中&#x…...

2026/6/2 8:48:38 阅读更多 →

别再傻等！用timeout命令给你的Linux脚本加个‘闹钟’，5分钟自动结束

别再傻等！用timeout命令给你的Linux脚本加个‘闹钟’，5分钟自动结束你是否遇到过这样的情况：在终端运行一个耗时脚本，本以为几分钟就能完成，结果却卡在那里一动不动？或者某个后台任务悄悄占用了系统资源&am…...

2026/6/2 8:46:40 阅读更多 →

Windows防撤回终极指南：如何永久保存微信QQ撤回消息

Windows防撤回终极指南：如何永久保存微信QQ撤回消息【免费下载链接】RevokeMsgPatcher :trollface: A hex editor for WeChat/QQ/TIM - PC版微信/QQ/TIM防撤回补丁（我已经看到了，撤回也没用了） 项目地址: https://gitcode.com/…...

2026/6/2 8:59:57 阅读更多 →

终极视频下载解决方案：VideoDownloadHelper 完全指南

终极视频下载解决方案：VideoDownloadHelper 完全指南【免费下载链接】VideoDownloadHelper Chrome Extension to Help Download Video for Some Video Sites. 项目地址: https://gitcode.com/gh_mirrors/vi/VideoDownloadHelper 还在为无法保存网络上的精彩…...

2026/6/1 16:51:08 阅读更多 →

小微企业合作网络与成长预测解析方案【附代码】

✨ 长期致力于小微企业、合作网络、网络结构、企业成长、成长预测研究工作，擅长数据搜集与处理、建模仿真、程序编写、仿真设计。 ✅ 专业定制毕设、代码 ✅ 如需沟通交流，点击《获取方式》 （1）基于提名生成法的合作网络构建与结构…...

2026/6/1 16:51:08 阅读更多 →

终极键盘映射工具：如何免费解决游戏按键冲突问题

终极键盘映射工具：如何免费解决游戏按键冲突问题【免费下载链接】socd Key remapper for epic gamers 项目地址: https://gitcode.com/gh_mirrors/so/socd 你是否曾在激烈的游戏中因为同时按下左右方向键而让角色卡顿不前？是否在关键时刻因为按键…...

2026/6/1 5:51:17 阅读更多 →