一、神经网络所属模块神经网络在SPSSAU中属于【机器学习】模块。二、方法概述神经网络是一类适合处理复杂非线性关系的机器学习方法既可以做分类也可以做回归。它适用于变量之间关系较复杂、传统线性方法难以充分刻画的数据分析场景。三、变量设置规则1.总体要求神经网络共需要设置2类变量分别是因变量Y和自变量X两类变量都为必填。2.具体设置1因变量Y● 只能放入1个变量且为必填。● 它是模型要预测的目标变量。若Y为类别数据通常对应分类任务若Y为定量数据通常对应回归任务。2自变量X● 最少放入1个最多可放入100个变量且为必填。● 它们是进入模型进行学习和预测的输入特征用于帮助模型识别数据规律。四、参数设置及解释说明1.训练集比例● 用于设置总样本中有多少比例参与模型训练默认值为0.8。● 训练样本比例越高模型学习通常越充分测试样本相应会减少。多数情况下可先采用默认设置。2.数据归一化● 可选None、norm、mas、mms。● None表示不处理norm表示正态标准化mas表示区间化mms表示归一化。● 神经网络对变量量纲较敏感当不同变量取值范围差异较大时通常建议进行数据处理。3.保存预测值● 勾选后会额外保存模型预测信息。● 分类任务下通常会保存预测类别和各类别预测概率回归任务下通常保存预测值。4.保存训练测试标识● 勾选后会生成训练集和测试集标识其中训练集记为1测试集记为2。● 适合后续核对样本划分也方便将分析结果回写到原始数据继续使用。5.交叉验证● 默认不进行也可以选择2折、3折、5折或10折。● 它用于检验模型在训练数据中的稳定性。折数越高结果通常更稳定但计算时间也会更长。6.激活函数● 可选identity、logistic、tanh、relu默认是relu。● 激活函数决定模型如何处理输入信息与非线性关系。若数据关系较复杂通常会优先考虑默认设置。7.权重优化方法● 可选lbfgs、sgd、adam默认是adam。● 它用于控制模型如何更新权重。adam在较大数据集上的表现通常较好sgd更适合配合学习率相关参数一起调整lbfgs适合部分较小样本场景。8. L2正则化/惩罚系数● 该参数用于控制正则化力度主要作用是降低过拟合风险。● 数值越大限制越强数值越小模型通常更容易贴合训练数据。若担心模型过拟合可适当提高该参数。9.初始学习率● 用于控制模型更新权重时每一步调整的幅度。● 该参数仅在权重优化方法为sgd或adam时使用。数值过大可能导致训练不稳定数值过小则可能收敛较慢。10.学习率优化方法● 可选constant、invscaling、adaptive默认是constant。● 该参数用于进一步控制学习率变化方式仅在权重优化方法为sgd时使用。● 如果希望训练过程更灵活可根据模型稳定性尝试不同选项。11. Batch Size● 可选auto或custom默认是auto。● 它表示每次随机优化时用于更新参数的样本批次大小。若选择auto系统会自动按规则确定。12.自定义Batch Size● 当Batch Size选择custom时使用。● 批次较小更新更频繁批次较大训练过程通常更平稳。实际设置时可结合样本量与训练速度一起考虑。13.最大迭代次数● 表示模型最多允许训练多少次默认值为200。● 如果达到该次数仍未收敛模型会停止。数据关系较复杂时可关注该参数是否影响结果稳定性。14.优化容忍度● 用于控制模型在什么条件下结束训练。● 当误差变化率小于该值时模型会停止构建。该值越小通常意味着模型收敛要求更严格。15.任务类型● 可选自动判断、分类任务、回归任务默认是自动判断。● 如果因变量类型非常明确系统通常可以自动识别若希望强制按分类或回归方式运行也可手动指定。16.隐层神经元设置● 可对隐层结构中的神经元个数进行设置默认展示第1层神经元数量。● 该设置会影响模型对复杂关系的学习能力。神经元数量增加后模型表达能力通常更强但也更容易出现过拟合。五、分析结果表格及其解读SPSSAU完成神经网络分析后会根据任务类型输出不同结果表常见包括基本信息汇总、特征权重值、模型评估结果、训练集模型评估结果、交叉验证模型评估结果、测试集模型评估结果、模型汇总表、AUC指标值和数据集情况。1.表1神经网络基本信息汇总或神经网络分类基本信息汇总这张表用于展示参与建模的数据概况。分类任务下会呈现各类别频数与占比回归任务下会呈现有效、缺失和总计情况。● 频数表示每个类别或状态对应的样本数量。若某一类别样本明显偏少后续识别结果通常更不稳定。● 百分比表示对应样本在总体中的占比。若类别分布差异很大模型可能更偏向样本量较多的类别。● 有效样本表示真正进入建模的数据量。有效样本越充分结果通常越可靠。● 缺失样本表示未进入模型的数据量。若缺失占比偏高需要更谨慎解读分析结果。2.表2特征权重值该表格在输出相关结果时出现用于展示各自变量在模型中的相对重要性包含项和权重值两个核心指标。● 项表示进入模型的特征名称。● 权重值表示变量对模型结果的相对贡献。通常数值越大说明该变量越重要更适合做变量之间的相对比较。3.表3模型评估结果或训练集模型评估结果这部分表格用于判断模型在训练阶段的表现。回归任务下通常包含R方值、MAE、MSE、RMSE、MAD、MAPE、EVS、MSLE等指标分类任务下通常包含精确率、召回率、f1-score和样本数。● R方值用于衡量模型解释结果变化的能力通常越接近1越好。● MAE表示平均误差水平越接近0越好越小说明预测偏差越小。● MSE表示误差平方后的平均水平越接近0越好对较大的误差更敏感。● RMSE表示整体误差水平越小越好便于直观理解预测偏差大小。● MAD表示中位数绝对误差对异常值不那么敏感越小越好。● MAPE表示平均百分误差越小越好适合观察相对误差水平。● EVS表示模型对数据波动的解释力度通常越接近1越好。● MSLE表示对数误差水平越小越好可作为辅助参考。● 精确率表示模型判定为某类时有多大概率判对越高越好。● 召回率表示某类别真实样本被识别出来的比例越高越好。● f1-score综合反映精确率与召回率的平衡情况越高越好。● 样本数表示对应类别参与评估的样本量样本量较少时该类指标波动可能更大。4.表4交叉验证模型评估结果或测试集模型评估结果交叉验证模型评估结果仅在开启交叉验证时输出用于观察模型在重复划分训练数据后的稳定表现测试集模型评估结果用于判断模型在未参与训练样本上的实际效果。● 如果交叉验证结果与训练集结果接近通常说明模型稳定性较好。● 如果测试集表现明显弱于训练集通常说明模型在新样本上的泛化能力一般后续可考虑调整参数或优化数据。5.表5模型汇总表或AUC指标值模型汇总表用于集中展示本次分析使用的参数设置及模型评估效果便于快速回顾建模方案AUC指标值在输出ROC相关结果时出现用于展示训练集和测试集的区分能力。● 参数名表示本次分析采用的参数项目。● 参数值表示对应参数的具体设置作用是帮助复现实验过程。● AUC用于衡量模型区分类别的能力通常越接近1越好若接近0.5通常说明区分能力较弱。6.表6数据集情况该表格用于展示训练集、测试集、预测集和缺失数据的数量与占比。● 训练集用于模型学习比例过低时模型可能学得不充分。● 测试集用于检验模型效果比例过少时评估稳定性可能不足。● 预测集表示仅用于生成预测结果的数据。● 缺失数据表示未能进入分析的数据量若占比偏高需要关注数据完整性问题。六、分析结果图表及其解读SPSSAU完成神经网络分析后常见会输出特征权重图在分类任务下还会输出测试集结果混淆矩阵和ROC曲线。1.图1特征权重图该图表本质上是条形图用于直观展示各特征在模型中的相对重要性。● 条形越长通常说明该特征对模型结果影响越大。● 如果少数变量明显高于其他变量说明模型更依赖这些关键特征。2.图2测试集结果混淆矩阵该图表在分类任务下输出用于查看真实类别与预测类别之间的对应关系是判断分类效果的直观图形。● 如果对角线位置数值更集中、更高通常说明模型分类更准确。● 如果非对角线位置数值较多说明某些类别更容易被混淆。3.图3ROC曲线该图表在分类任务下输出用于展示模型在不同判定阈值下的区分能力通常可同时查看训练集和测试集表现。● 曲线越靠近左上方通常说明模型区分能力越强。● 若测试集曲线明显弱于训练集通常说明模型在新样本上的稳定性一般。● 实际解读时建议结合AUC指标值一起看这样更容易判断模型是否具有较好的分类能力。以上就是SPSSAU神经网络的相关内容更深入教程可查看SPSSAU帮助手册、教学视频、疑难解惑等资料。