保姆级教程：用Python3.6复现吴恩达机器学习课后作业（附完整代码与避坑指南）

张

张建站

2026/4/24 19:28:05

10分钟阅读

保姆级教程：用Python3.6复现吴恩达机器学习课后作业（附完整代码与避坑指南）

用Python3.6复现吴恩达机器学习课后作业从环境配置到实战避坑当你在Coursera上完成吴恩达教授的机器学习课程后是否曾对着那些Octave作业感到无从下手作为一门经典的入门课程其教学价值毋庸置疑但原作业使用的Octave语言在当今Python主导的机器学习生态中显得有些格格不入。本文将带你用Python3.6完整复现所有编程练习不仅还原算法本质更融入现代Python数据科学生态的最佳实践。1. 环境搭建与工具链配置复现作业的第一步是搭建一个与课程内容匹配但又能适应现代Python开发的环境。不同于简单地安装Anaconda我们需要精心配置工具链以确保与课程算法的兼容性。核心工具栈选择Python 3.6.x与课程数学运算保持最佳兼容NumPy 1.19.5最后一个全面支持Python3.6的稳定版本Matplotlib 3.3.4兼容性最佳的绘图库版本SciPy 1.5.4科学计算基础库# 创建专用虚拟环境 conda create -n ml-ng python3.6.13 conda activate ml-ng # 安装核心依赖指定版本避免冲突 pip install numpy1.19.5 matplotlib3.3.4 scipy1.5.4 pandas1.1.5注意避免使用Python3.7版本某些课程中的矩阵运算在更高版本NumPy中的行为会有微妙差异对于IDE的选择推荐VS Code配合Jupyter插件既能交互式调试又支持完整项目开发。特别建议安装Python Extension Pack和Jupyter插件配置如下工作区设置{ python.pythonPath: ml-ng/bin/python, jupyter.notebookFileRoot: ${workspaceFolder}, python.linting.pylintEnabled: true }2. 线性回归作业的Python实现与优化课程的第一个编程作业是单变量线性回归原Octave代码大量依赖矩阵操作。我们用NumPy重写时需要注意几点关键差异关键实现对比Octave操作Python等效实现注意事项theta * Xtheta.T XNumPy中是矩阵乘法运算符sum((X*theta-y).^2)np.sum((X theta - y)**2)平方运算需显式使用**pinv(X*X)*X*ynp.linalg.pinv(X.T X) X.T y正规方程的实现差异完整的多变量线性回归实现示例def compute_cost(X, y, theta): m len(y) predictions X theta sq_errors (predictions - y)**2 J 1/(2*m) * np.sum(sq_errors) return J def gradient_descent(X, y, theta, alpha, iterations): m len(y) cost_history [] for _ in range(iterations): error X theta - y theta theta - (alpha/m) * (X.T error) cost_history.append(compute_cost(X, y, theta)) return theta, cost_history常见报错与解决维度不匹配错误Octave自动广播规则与NumPy不同务必显式检查X.shape和theta.shape收敛问题Python中需要更小的学习率尝试0.01而非Octave的0.1可视化差异Matplotlib默认样式与Octave不同需手动设置plt.style.use(seaborn)3. 逻辑回归与正则化的现代实现逻辑回归作业涉及更复杂的优化算法。原课程使用fminunc而Python生态中有更高效的选择优化算法对比选择方法实现方案适用场景原生梯度下降手动实现教学理解scipy.optimizeminimize(methodBFGS)平衡精度与速度scipy.optimizeminimize(methodTNC)约束优化问题正则化逻辑回归的核心实现技巧def sigmoid(z): return 1 / (1 np.exp(-z)) def cost_function_reg(theta, X, y, lambda_): m len(y) h sigmoid(X theta) reg_term (lambda_/(2*m)) * np.sum(theta[1:]**2) J (-1/m) * (y.T np.log(h) (1-y).T np.log(1-h)) reg_term return J def gradient_reg(theta, X, y, lambda_): m len(y) h sigmoid(X theta) grad (1/m) * X.T (h - y) grad[1:] (lambda_/m) * theta[1:] # 不正则化theta0 return grad提示使用scipy.optimize.minimize时将jacTrue传入以使用自定义梯度函数可大幅提升收敛速度特征映射的Python优化技巧课程中的多项式特征生成在Octave中效率较低改用sklearn.preprocessing.PolynomialFeatures即使不借助GPU也能获得百倍加速from sklearn.preprocessing import PolynomialFeatures def map_feature(X1, X2, degree6): poly PolynomialFeatures(degree) return poly.fit_transform(np.column_stack((X1, X2)))4. 神经网络与反向传播的工程化实现第三周的神经网络作业是最具挑战性的部分。原Octave实现暴露了底层细节但在Python中我们可以采用更工程化的方法权重初始化策略对比方法实现代码优点随机初始化theta 0.12 * (2 * np.random.rand(size) - 1)课程原始方法He初始化theta np.random.randn(size) * np.sqrt(2/n_features)更适合ReLUXavier初始化theta np.random.randn(size) * np.sqrt(1/n_features)适合sigmoid/tanh向量化实现反向传播的关键步骤def backprop(params, input_size, hidden_size, num_labels, X, y, lambda_): # 解压参数 theta1 params[:hidden_size*(input_size1)].reshape(hidden_size, input_size1) theta2 params[hidden_size*(input_size1):].reshape(num_labels, hidden_size1) m X.shape[0] Delta1 np.zeros_like(theta1) Delta2 np.zeros_like(theta2) # 前向传播 a1 np.hstack([np.ones((m,1)), X]) z2 a1 theta1.T a2 np.hstack([np.ones((m,1)), sigmoid(z2)]) z3 a2 theta2.T h sigmoid(z3) # 计算误差 y_matrix np.eye(num_labels)[y-1] delta3 h - y_matrix delta2 delta3 theta2[:,1:] * sigmoid_gradient(z2) # 累积梯度 Delta2 delta3.T a2 Delta1 delta2.T a1 # 正则化 theta1_reg np.hstack([np.zeros((theta1.shape[0],1)), theta1[:,1:]]) theta2_reg np.hstack([np.zeros((theta2.shape[0],1)), theta2[:,1:]]) grad1 Delta1/m (lambda_/m)*theta1_reg grad2 Delta2/m (lambda_/m)*theta2_reg return np.concatenate([grad1.ravel(), grad2.ravel()])调试技巧使用np.gradient检查数值梯度与解析梯度的一致性可视化各层权重分布发现初始化问题对成本函数曲线添加滑动平均平滑处理pd.Series(costs).rolling(50).mean()5. 支持向量机与K-means的现代替代方案虽然课程使用SVM和K-means作为无监督学习的示例但Python生态提供了更强大的实现scikit-learn优化实现对比课程算法sklearn等效类关键参数优化SVMsklearn.svm.SVC(kernellinear, C1)调整C值控制正则化强度K-meanssklearn.cluster.KMeans(n_clusters3)使用kmeans初始化高斯核函数的工程实现技巧def gaussian_kernel(x1, x2, sigma): return np.exp(-np.sum((x1 - x2)**2) / (2 * sigma**2)) # 向量化版本用于计算Gram矩阵 def gaussian_kernel_matrix(X1, X2, sigma): pairwise_dists np.sum(X1**2, axis1)[:, np.newaxis] np.sum(X2**2, axis1) - 2 * X1 X2.T return np.exp(-pairwise_dists / (2 * sigma**2))性能优化技巧对大数据集使用sklearn.metrics.pairwise_distances_argmin_min加速K-means分配对SVM使用SVC(kernelprecomputed)配合预先计算的核矩阵利用joblib并行化交叉验证过程6. 异常检测与推荐系统的生产级实现课程最后两章的作业可以延伸出现代数据流水线的最佳实践异常检测的改进方案from sklearn.covariance import EllipticEnvelope def multivariate_gaussian(X, mu, sigma2): k len(mu) X_centered X - mu sigma2_diag np.diag(sigma2) denominator np.sqrt((2*np.pi)**k * np.linalg.det(sigma2_diag)) exponent -0.5 * np.sum(X_centered np.linalg.pinv(sigma2_diag) * X_centered, axis1) return np.exp(exponent) / denominator # 使用鲁棒协方差估计 clf EllipticEnvelope(contamination0.02) clf.fit(X_train) y_pred clf.predict(X_test)推荐系统的增量学习实现from surprise import Dataset, KNNBasic from surprise.model_selection import train_test_split def train_recommender(ratings): reader Reader(rating_scale(1, 5)) data Dataset.load_from_df(ratings[[user, item, rating]], reader) trainset, testset train_test_split(data, test_size0.25) sim_options { name: cosine, user_based: False # 基于物品的协同过滤 } algo KNNBasic(k40, min_k5, sim_optionssim_options) algo.fit(trainset) return algo在实际项目中这些算法需要配合特征工程流水线和超参数优化框架如Optuna才能发挥最大效用。

Spring Boot开发中，@RequestParam、@RequestBody、@PathVariable到底怎么选？一个真实项目案例讲清楚

Spring Boot参数绑定注解实战指南：从困惑到精通刚接触Spring Boot时，面对各种参数绑定注解总是让人摸不着头脑。记得我第一次写用户注册接口时，在RequestParam和RequestBody之间反复横跳，测试时不是400错误就是空指针异常。本文将…...

2026/4/24 19:20:55 阅读更多 →

Python机器学习入门：从基础到实战

1. Python机器学习入门指南作为一名在数据科学领域摸爬滚打多年的从业者，我经常被问到同一个问题："如何用Python开始机器学习？"这让我想起2014年PyCon大会上Melanie Warrick那场精彩的演讲。25分钟的分享浓缩了她多年实战经验&…...

2026/4/24 19:11:24 阅读更多 →

用C++手把手实现地震波走时计算：从基础FSM到SPAFSM改进（附完整代码）

用C手把手实现地震波走时计算：从基础FSM到SPAFSM改进（附完整代码） 地震波走时计算是地球物理勘探中的核心问题之一，它直接关系到地震成像的精度和可靠性。快速扫描法(Fast Sweeping Method, FSM)因其计算效率高、实现简单而广受欢…...

2026/4/24 19:10:56 阅读更多 →

从T3到T5：全志工控处理器性能跃迁与工业应用场景深度解析

1. 全志T3与T5处理器核心架构解析全志T3（A40I）和T5（T507）作为两代工控处理器，在核心架构上有着显著差异。T3采用四核Cortex-A7架构，主频1.2GHz，搭配Mali400MP2 GPU，属于经典的"…...

2026/4/24 19:27:19 阅读更多 →

Elasticsearch 运维必备：列出集群所有索引的5种方法（最全+图解+实战）

Elasticsearch 运维必备：列出集群所有索引的5种方法（最全图解实战）一、前言二、列出 ES 所有索引：整体流程流程图三、Elasticsearch 列出所有索引：核心命令3.1 方法1：_cat/indices（最常用、运维…...

2026/4/24 19:27:19 阅读更多 →

SAP PI/PO HTTPS接口调用实战：从SSL证书导入到彻底告别iaik.security.ssl.SSLCertificateException

1. 当SAP PI/PO遇到HTTPS接口报错时发生了什么？ 最近在帮客户调试SAP PI系统调用外部HTTPS接口时，遇到了一个让人头疼的问题。系统在调用Swagger Petstore的API时，控制台突然抛出"iaik.security.ssl.SSLCertificateException: Peer cert…...

2026/4/24 19:27:20 阅读更多 →