大家好,我是皮皮。
一、前言
前几天在Python最强王者交流群【哎呦喂 是豆子~】问了一个Python
自动化办公的问题,一起来看看吧。
下图是他的原始数据和他想得到的目标数据,如下所示:
需要在标黄的两行里边进行相关操作。
二、实现过程
之前的文章中【莫生气】使用了openpyxl进行了实现,的确可行,但是那只是针对小批量数据表,单单几个漏洞的情况下,还算可以hold住的,但是在多个漏洞的情况下,比方说几十个这样,那挨个的去写,还是非常吃力里的。这一篇文章我们一起来看看【隔壁😼山楂】大佬给出的pandas实现,非常秀儿。
下面是他提供的代码:
# 筛选或条件
dfc1 = df.groupby(['系统名称', '漏洞名称', '是否提供误报证明']).agg({'ip': 'unique'}).rename(columns={'ip': '已提供误报证明ip'}).reset_index()
dfc2 = df.groupby(['系统名称', '漏洞名称', '是否提供无法整改证明']).agg({'ip': 'unique'}).rename(columns={'ip': '已提供无法整改证明ip'}).reset_index()
res = dfc1.merge(dfc2, how='outer', left_notallow=['系统名称', '漏洞名称', '是否提供误报证明'], right_notallow=['系统名称', '漏洞名称', '是否提供无法整改证明'])
res1 = res.loc[res['是否提供误报证明'].eq('是') & res['是否提供无法整改证明'].eq('是')].copy()
res1.set_index(['系统名称', '漏洞名称'], inplace=True)
# 筛选与条件
res2 = df[df['是否提供误报证明'].eq('否') & df['是否提供无法整改证明'].eq('否')].groupby(['系统名称', '漏洞名称']).agg({'ip': 'unique'}).rename(columns={'ip': '没有误报和无法整改证明的ip'})
# 结果合并
res = res1.join(res2, how='outer').fillna('')
# 将结果列表处理成字符串
ip_cols = res.columns[res.columns.str.contains('ip')]
res[ip_cols] = res[ip_cols].applymap(', '.join)
# 无ip的单元格用无填充
res[ip_cols] = res[ip_cols].where(res[ip_cols].ne(''), '无')
# 保存结果
res.to_excel('result.xlsx', index=False)
这个简单来说就是筛选三次,三次的结果进行合并,运行之后可以得到预期的效果图如下所示:
顺利地解决了粉丝的问题。细心的小伙伴可能已经发现了,这里只是显示了2个漏洞的情况,那么针对多漏洞的情况,又该如何进行实现呢?下一篇文章,【隔壁😼山楂】继续给大家带来惊喜,敬请期待!
三、总结
大家好,我是皮皮。这篇文章主要盘点了一个Python
自动化办公实战的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。
最后感谢粉丝【哎呦喂 是豆子~】提问,感谢【莫生气】、【隔壁😼山楂】给出的思路和代码解析,感谢【鶏啊鶏。】、【Ineverleft】等人参与学习交流。
【提问补充】温馨提示,大家在群里提问的时候。可以注意下面几点:如果涉及到大文件数据,可以数据脱敏后,发点demo数据来(小文件的意思),然后贴点代码(可以复制的那种),记得发报错截图(截全)。代码不多的话,直接发代码文字即可,代码超过50行这样的话,发个.py文件就行。