Pandas 使用

张

张建站

2026/5/15 3:47:08

10分钟阅读

1. value_counts()统计某个列Series中各个唯一值出现的频率次数2. ffill()# 使用前向填充和后向填充的方法填补缺失值 4分data[Value].ffill(inplaceTrue)data[Value].bfill(inplaceTrue)# inplaceTrue 直接修改原数据1. 求比例# 1. 总患者数totallen(data)# 2. 分别统计高/低风险人数high_count(data[RiskLevel]高风险患者).sum()low_count(data[RiskLevel]低风险患者).sum()# 3. 计算比例high_ratehigh_count/total low_ratelow_count/total# 输出转百分比更直观print(f高风险患者占比{high_rate:.2%})print(f低风险患者占比{low_rate:.2%})# 直接统计所有RiskLevel的占比, key(RiskLevel值)-value(比例小数)risk_ratiodata[RiskLevel].value_counts(normalizeTrue)# 单独提取高、低风险print(高风险患者占比,risk_ratio[高风险患者])print(低风险患者占比,risk_ratio[低风险患者])# 分组求比例True1False0mean()占比high_rate(data[RiskLevel]高风险患者).mean()low_rate(data[RiskLevel]低风险患者).mean()print(f高风险患者占比{high_rate:.2%})print(f低风险患者占比{low_rate:.2%})2. numpy where 函数importnumpyasnp# 1. 纯数字数组不用任何数据集arrnp.array([18,25,30,16])# 用 np.where 判断 BMI 范围resultnp.where(arr28,肥胖,正常)print(result)# 输出[正常正常肥胖正常]# 创建新列RiskLevel根据住院天数判断风险等级data[RiskLevel]np.where(data[DaysInHospital]7,高风险患者,低风险患者)3. cut 函数 (类似 case when)连续数值 → 分段打标签importnumpyasnpimportpandasaspd# 1. 定义边界5个边界bmi_bins[0,18.5,24,28,np.inf]# 2. 定义标签4个标签对应4个区间bmi_labels[偏瘦,正常,超重,肥胖]# 3. 执行分段给每个BMI值分配区间标签data[BMIRange]pd.cut(data[BMI],binsbmi_bins,labelsbmi_labels,rightFalse# 左闭右开[0,18.5) [18.5,24) ...)4. groupby 函数

从Websocket到Elasticsearch看板：手把手教你搭建IoT设备实时监控系统

从Websocket到Elasticsearch看板：手把手教你搭建IoT设备实时监控系统当工厂车间的温度传感器突然报警，或是智能家居设备频繁离线时，运维团队往往需要争分夺秒定位问题。传统轮询式监控就像用望远镜观察星空——你永远只能看到过去某一刻的静…...

2026/5/15 3:42:09 阅读更多 →

工程铲车远程监控运维管理系统方案

在矿山开采、港口物流及大型基建项目的复杂工况中，工程铲车（装载机、推土机、铲运机等）作为核心生产工具，其运行稳定性直接决定着项目的进度与效益。然而，传统的工程铲车管理模式多依赖人工巡检与经验判断，…...

2026/5/15 3:42:07 阅读更多 →

AI工程化实战：从模型到服务的全链路部署与优化指南

1. 项目概述：一个面向AI应用开发的综合框架最近在开源社区里，Sunpeak-AI/sunpeak 这个项目引起了我的注意。它不是一个单一的模型或工具，而是一个旨在为AI应用开发提供“一站式”解决方案的框架。简单来说，你可以把它理解为一个工…...

2026/5/15 3:33:05 阅读更多 →

CANN/pyasc Dump检查点功能

asc.language.basic.dump_acc_chk_point 【免费下载链接】pyasc 本项目为Python用户提供算子编程接口，支持在昇腾AI处理器上加速计算，接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc asc.language.basi…...

2026/5/15 1:31:46 阅读更多 →