pandas数据框,统计某列数据对应的个数方法
作者:CommaDou 发布时间:2023-08-12 11:39:39
标签:pandas,数据框,数据,统计
现在要解决的问题如下:
我们有一个数据的表
第7列有许多数字,并且是用逗号分隔的,数字又有一个对应的关系:
我们要得到第7列对应关系的统计,就是每一行的第7列a有多少个,b有多少个
好了,我给的解决方法如下:
#!/bin/python
#-*-coding:UTF-8-*-
import pandas as pd
import numpy as np
dfidspec = pd.read_table("one.txt")#这个是对应关系的文件
dfmgs = pd.read_table("two.txt",header = None)#这个是我们数据的表
def getlistnum(li):#这个函数就是要对列表的每个元素进行计数
set1 = set(li)
dict1 = {}
for item in set1:
dict1.update({item:li.count(item)})
return dict1
bigdict = dict(zip(dfidspec['ID'],dfidspec['class']))#获得一个关系的字典
dfmgs['indeo'] = 'a'#在读取的数据框新建一个字符列
for i in range(len(dfmgs.index)):#对每一行进行操作
spp = [bigdict[int(j)] for j in dfmgs.iloc[i, 6].split(',')]#对于第7列的格子中的每个数进行字典取值
sppnum = getlistnum(spp)
dfmgs.iloc[i, 7] = str(sppnum)
dfmgs.to_csv("three.txt",sep = '\t',index = False)
这个就可以得到想要的结果了:
来源:https://blog.csdn.net/sinat_38893241/article/details/77945740


猜你喜欢
- 前言说起这个事情吧也相对来说比较尴尬,对于一个技术来说忘记密码然后找回密码都是相当简单的一个事情,但是在生产环境中没有保存记录只能是自己的失
- 效果如下,dialog中内容自行添加<template> <div> <div class="dia
- 本文实例讲述了Python装饰器基础概念与用法。分享给大家供大家参考,具体如下:装饰器基础前面快速介绍了装饰器的语法,在这里,我们将深入装饰
- 开发环境:Pycharm 2018.3 + Anaconda3(5.3.0) + Python 3.7.1 + Numpy 1.15.4在此
- Tensorflow可以使用训练好的模型对新的数据进行测试,有两种方法:第一种方法是调用模型和训练在同一个py文件中,中情况比较简单;第二种
- 不过有一个简单的执行cmd命令方法: SQL> host net user User accounts for \\PC-ATQHJ4
- 4. 生成器(generator)4.1. 生成器简介首先请确信,生成器就是一种迭代器。生成器拥有next方法并且行为与迭代器完全相同,这意
- 先说结论model.state_dict()是浅拷贝,返回的参数仍然会随着网络的训练而变化。应该使用deepcopy(model.state
- 当使用PHP在MySQL中编写查询时,它的适用性将基于MySQL本身进行检查。所以使用MySQL提供的默认日期和时间格式,即'YYY
- 在开始使用Go进行编码时,Defer是要关注的一个很重要的特性。它非常简单:在任何函数中,给其他函数的调用加上前缀 defer以确保该函数在
- 本文实例为大家分享了Vue+Websocket简单实现聊天功能的具体代码,供大家参考,具体内容如下效果图:聊天室此篇文章是针对Websock
- 本文实例为大家分享了python实现自动登录后台管理系统的具体代码,供大家参考,具体内容如下首先感谢下网络上的各位大神和博主,通过学习各位大
- 以下操作演示都是基于mysql5.6.36版本:工作中经常遇到这样的问题:mysql数据访问能量很大,想要从sql方面优化。研发经常会问到能
- 一、MySQl命令行客户端在Mysql安装完成后,Mysql命令行会自动配置在计算机上,在菜单中找到MySql 8.0 Command Li
- 索引是什么索引是一种特殊的文件,包含着对数据表里所有记录的引用指针。可以对表中的一列或多列创建索引,并指定索引的类型,各类索引有各自的数据结
- 1.在pycharm下安装scrapy函数库2.将安装好scrapy函数库下的路径配置到系统path的环境变量中3.打开cmd终端输入:sc
- 一:背景以及项目结构介绍第一次将自己做的python爬虫项目打包成exe,搜了很多网上教程,大部分都是打包一个py文件的小demo,这里先给
- 功能:间隔5毫秒,快速点击屏幕某区域,循环45000000次from ctypes import *import timetime.slee
- z-blog摘要图文混排,在月光的博客早已有介绍,但是他的图文混排是基于一篇文章只定义一个Tag的情况,对于我这样习惯多tag的博客,再更改
- 总是记不住API。昨晚写的时候用到了这些,但是没记住,于是就索性整理一下吧:python中对文件、文件夹(文件操作函数)的操作需要涉及到os