0
点赞
收藏
分享

微信扫一扫

# yyds干货盘点 # 盘点一个Python自动化办公实战实现数据汇总填充(方法四)

大家好,我是皮皮。

一、前言

前几天在Python最强王者交流群【哎呦喂  是豆子~】问了一个Python自动化办公的问题,一起来看看吧。

# yyds干货盘点 # 盘点一个Python自动化办公实战实现数据汇总填充(方法四)_数据

下图是他的原始数据和他想得到的目标数据,如下所示:

# yyds干货盘点 # 盘点一个Python自动化办公实战实现数据汇总填充(方法四)_Python入门_02

需要在标黄的两行里边进行相关操作。

二、实现过程

之前的文章中【莫生气】使用了openpyxl进行了实现,的确可行,但是那只是针对小批量数据表,单单几个漏洞的情况下,还算可以hold住的,但是在多个漏洞的情况下,比方说几十个这样,那挨个的去写,还是非常吃力里的。这一篇文章我们一起来看看【隔壁😼山楂】大佬给出的pandas实现,非常秀儿。

下面是他提供的代码:

# 筛选或条件
dfc1 = df.groupby(['系统名称', '漏洞名称', '是否提供误报证明']).agg({'ip': 'unique'}).rename(columns={'ip': '已提供误报证明ip'}).reset_index()
dfc2 = df.groupby(['系统名称', '漏洞名称', '是否提供无法整改证明']).agg({'ip': 'unique'}).rename(columns={'ip': '已提供无法整改证明ip'}).reset_index()
res = dfc1.merge(dfc2, how='outer', left_notallow=['系统名称', '漏洞名称', '是否提供误报证明'], right_notallow=['系统名称', '漏洞名称', '是否提供无法整改证明'])
res1 = res.loc[res['是否提供误报证明'].eq('是') & res['是否提供无法整改证明'].eq('是')].copy()
res1.set_index(['系统名称', '漏洞名称'], inplace=True)
# 筛选与条件
res2 = df[df['是否提供误报证明'].eq('否') & df['是否提供无法整改证明'].eq('否')].groupby(['系统名称', '漏洞名称']).agg({'ip': 'unique'}).rename(columns={'ip': '没有误报和无法整改证明的ip'})
# 结果合并
res = res1.join(res2, how='outer').fillna('')
# 将结果列表处理成字符串
ip_cols = res.columns[res.columns.str.contains('ip')]
res[ip_cols] = res[ip_cols].applymap(', '.join)
# 无ip的单元格用无填充
res[ip_cols] = res[ip_cols].where(res[ip_cols].ne(''), '无')
# 保存结果
res.to_excel('result.xlsx', index=False)

这个简单来说就是筛选三次,三次的结果进行合并,运行之后可以得到预期的效果图如下所示:

# yyds干货盘点 # 盘点一个Python自动化办公实战实现数据汇总填充(方法四)_数据_03

顺利地解决了粉丝的问题。细心的小伙伴可能已经发现了,这里只是显示了2个漏洞的情况,那么针对多漏洞的情况,又该如何进行实现呢?下一篇文章,【隔壁😼山楂】继续给大家带来惊喜,敬请期待!

三、总结

大家好,我是皮皮。这篇文章主要盘点了一个Python自动化办公实战的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。

最后感谢粉丝【哎呦喂  是豆子~】提问,感谢【莫生气】、【隔壁😼山楂】给出的思路和代码解析,感谢【鶏啊鶏。】、【Ineverleft】等人参与学习交流。

【提问补充】温馨提示,大家在群里提问的时候。可以注意下面几点:如果涉及到大文件数据,可以数据脱敏后,发点demo数据来(小文件的意思),然后贴点代码(可以复制的那种),记得发报错截图(截全)。代码不多的话,直接发代码文字即可,代码超过50行这样的话,发个.py文件就行。

# yyds干货盘点 # 盘点一个Python自动化办公实战实现数据汇总填充(方法四)_Python_04

举报

相关推荐

0 条评论