Python自动采集微信联系人的实现示例
作者:同哥聊技术 发布时间:2023-09-08 07:28:03
疫情终于有所好转了,感谢所有的为之奋斗的白衣天使们,你们是最棒的!赞!
白衣天使们在前线奋战,我们也总不能总在家里躺着做贡献,也要加强学习,争取开春有个好工作:)
这周花了几天的时间,把Python的pywinauto相关的使用及一堆的库函数看了一遍,感觉这个库还是非常强大的。
pywinauto是什么?
pywinauto是一组用于自动化Windows GUI的python模块。简单地说,它允许您将鼠标和键盘操作发送到windows对话框和控件。这是官方的解释,简单说就是可以用python代码来操纵桌面程序。
安装
pip install pywinauto
使用
pywinauto的使用方式原理很简单,但是它提供了大量的对GUI界面元素操作的函数,需要慢慢去理解。
官方文档资料很齐全:https://pywinauto.readthedocs.io/
入门级的细节就不说了,看不懂官方英文,也可以去网上搜索,一大堆的介绍文档。
我们直接进入今天的主题:用Python采集微信联系人,先上程序执行效果视频:
程序原理
(1)首先微信要打开,并登录成功。获取当前微信的进程ID:
PID=0
for proc in psutil.process_iter():
try:
pinfo = proc.as_dict(attrs=['pid','name'])
except psutil.NoSuchProcess:
pass
else:
if 'WeChat.exe' == pinfo['name']:
PID = pinfo['pid']
(2)使用pywinauto 连接到这个进程:
app = Application(backend='uia').connect(process=PID)
win = app[u'微信']
(3)找到左边的“通讯录”按钮所在位置,点击鼠标:
addresslist = win.child_window(title=u"通讯录", control_type="Button")
addresslist.draw_outline()
cords = addresslist.rectangle()
pywinauto.mouse.click(button='left', coords=(cords.left + 10, cords.top+10))
win.draw_outline()
(4)核心代码,通过调用向下的键盘指令,逐个打开联系人详情页,根据详情页的页面结构,页面内的所有数据:呢称、备注、地区、微信号、来源。
#联系人
con_list = win.child_window(title=u"联系人", control_type="List")
pywinauto.mouse.click(button='left', coords=(cords.left + 100, cords.top+10))
data = []
while True:
con_list.type_keys("{DOWN}")
rect_edit = win.Edit2.rectangle()
#找到联系人详情页
if rect_edit.left > cords.left + 300:
#整个面板
page = {u'呢称':'',u'备 注':'',u'地 区':'',u'微信号':'',u'来 源':''}
#呢称
win.Edit2.draw_outline()
page[u'呢称'] = win.Edit2.get_value()
#由于详情页面要素不固定,不能用控件序号来检索
static_wxh = win.child_window(title=u"微信号", control_type="Text")
Pane46 = static_wxh.parent().parent()
for item in Pane46.children():
item.draw_outline()
lines = item.children()
key = lines[0].window_text()
value = lines[1].window_text()
page[key] = value
data.append(page)
#最后一个联系人时停止
if len(data) >2 and data[-2][u'微信号'] == data[-1][u'微信号']:
data.remove(data[-1])
saveTxt(data)
break
第四步的方法前后优化过多次,这是最后优化的版本,这个版本是多种方案中速度最快,同时兼容性最好的方法,如果哪位朋友还有更好的方案,欢迎留言讨论!
下面附上完整代码:
#coding=gbk
'''
Created on
@author: Administrator
'''
import psutil
import pywinauto
from pywinauto.application import Application
import os
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
def getWinxin():
PID=0
for proc in psutil.process_iter():
try:
pinfo = proc.as_dict(attrs=['pid','name'])
except psutil.NoSuchProcess:
pass
else:
if 'WeChat.exe' == pinfo['name']:
PID = pinfo['pid']
app = Application(backend='uia').connect(process=PID)
win = app[u'微信']
addresslist = win.child_window(title=u"通讯录", control_type="Button")
addresslist.draw_outline()
cords = addresslist.rectangle()
pywinauto.mouse.click(button='left', coords=(cords.left + 10, cords.top+10))
win.draw_outline()
#联系人
con_list = win.child_window(title=u"联系人", control_type="List")
pywinauto.mouse.click(button='left', coords=(cords.left + 100, cords.top+10))
data = []
while True:
con_list.type_keys("{DOWN}")
rect_edit = win.Edit2.rectangle()
#找到联系人详情页
if rect_edit.left > cords.left + 300:
#整个面板
page = {u'呢称':'',u'备 注':'',u'地 区':'',u'微信号':'',u'来 源':''}
#呢称
win.Edit2.draw_outline()
page[u'呢称'] = win.Edit2.get_value()
#由于详情页面要素不固定,不能用控件序号来检索
static_wxh = win.child_window(title=u"微信号", control_type="Text")
Pane46 = static_wxh.parent().parent()
for item in Pane46.children():
item.draw_outline()
lines = item.children()
key = lines[0].window_text()
value = lines[1].window_text()
page[key] = value
data.append(page)
#最后一个联系人时停止
if len(data) >2 and data[-2][u'微信号'] == data[-1][u'微信号']:
data.remove(data[-1])
saveTxt(data)
break
def saveTxt(data):
with open("data.txt",'ab') as f:
f.write(u'微信号,备注,地区,来源,呢称\r\n')
for item in data:
f.write('%s,%s,%s,%s,%s\r\n' % (item[u'微信号'],item[u'备 注'],item[u'地 区'],item[u'来 源'],item[u'呢称']))
os.system('notepad.exe data.txt')
if __name__ == '__main__':
getWinxin()
来源:https://blog.csdn.net/qq_27923467/article/details/104455114
猜你喜欢
- 今天使用shuffleNetV2+,使用自己的数据集,遇到了loss是nan的情况,而且top1精确率出现断崖式上升,这显示是不正常的。在网
- 一般情况下:if(2 > 10){alert("不正确!");} 此比较不会是想要的结果:它相当于2 >1,
- 本文实例讲述了Python使用pyautocad+openpyxl处理cad文件。分享给大家供大家参考,具体如下:示例1:from pyau
- 本文实例讲述了Python实现通过文件路径获取文件hash值的方法。分享给大家供大家参考,具体如下:import hashlibimport
- 本文实例讲述了Python字符串、列表、元组、字典、集合。分享给大家供大家参考,具体如下:附加:python的很多编译器提供了代码补全功能,
- 1.下载下载链接点击download,这里可能需要登录甲骨文的账号,登录一下即可2.解压下载好会得到一个安装包把它解压到一个能找到的目录下即
- 装饰器是程序开发中经常会用到的一个功能,也是python语言开发的基础知识,如果能够在程序中合理的使用装饰器,不仅可以提高开发效率,而且可以
- 案例:爬取使用搜狗根据指定词条搜索到的页面数据(例如爬取词条为‘周杰伦'的页面数据)import urllib.request# 1
- Background之前数据库只区分了Android,IOS两个平台,游戏上线后现在PM想要区分国服,海外服,港台服。这几个字段从前端那里的
- 本文实例讲述了Python实现按特定格式对文件进行读写的方法。分享给大家供大家参考,具体如下:#! /usr/bin/env python#
- 现在我们已经很熟悉Django的MTV模式了。模板(template)负责如何去展示数据,而视图(view)负责筛选出正确的数据。因此通常来
- 前言去年暑假参加了一个比赛,比赛内容中需要确定目标的位置 本来想全用图像完成的,最后发现不是很符合要求。比完赛之后,就忙别的事了。直到现在突
- 本文实例讲述了Python实现的求解最小公倍数算法。分享给大家供大家参考,具体如下:简单分析了一下,前面介绍的最大公约数的求解方法跟最小公倍
- 目录1.自定义行索引2. 按普通索引选择数据2.1 按普通索引选择单行数据2.2 按行索引选择多行数据3.按位置索引选择数据3.2 按位置索
- MySQL数据库配置技巧用root用户启动远程服务一直是安全大忌,因为如果服务程序出现问题,远程攻击者极有可能获得主机的完全控制权。MySQ
- 最近又新上了一部分站点,随着站点的增多,管理复杂性也上来了,俗话说:人多了不好带,我发现站点多了也不好管,因为这些站点里有重要的也有不重要的
- 本文介绍使用aspjpeg组件实现图片的半透明描边的效果,描边效果演示:参数说明'big 原图路径(相对)'small 生成
- 本文为大家分享了python2.7.14的安装教程,供大家参考,具体内容如下1.下载python2.7.14下载地址根据自己电脑配置进行选择
- 本文实例介绍了如何使用ASP代码来读写注册表,呵呵厉害吧! 一个例子: <%Dim ReadComputerNam
- 本文实例讲述了Python常用模块之requests模块用法。分享给大家供大家参考,具体如下:一. GET请求1.访问一个页面import