Pandas 中的join函数应用实现删除多余的空行
作者:开始King 发布时间:2023-08-21 01:00:38
标签:Pandas,join函数,删除,多余,空行
str.join
即sequence
– 要连接的元素序列。
返回通过指定字符连接序列中元素后生成的新字符串。
n = 'abc'
n1 = '-'.join(n)
# n1 'a-b-c'
n = ['we', 'are', 'programmer']
n = ' '.join(n)
# 'we are programmer'
在数据处理中可能经常会使用join函数,比如:
一、有机肥料上下面多了一行空行;二、有机肥料下面多了一行空行,
情况入下图所示:
其实处理很简单只需要对这一列数据应用自定义函数
.apply(lambda x: " ".join(x.split()))
如果看不太明白可以先把这个问题拆开看
先把这两个异常值读入进来
data
Out[15]: '\n有机肥料\n'
data_1
Out[16]: '有机肥料\n'
使用split()
进行切片(分隔符默认为所有的空字符,包括空格、换行(\n)、制表符(\t)等)
data = data.split()
data
Out[18]: ['有机肥料']
然后join
连接
n = " ".join(data)
n
Out[23]: '有机肥料'
来源:https://blog.csdn.net/m0_52118763/article/details/121427091


猜你喜欢
- 提起数据库,第一个想到的公司,一般都会是Oracle。该公司成立于1977年,最初是一家专门开发数据库的公司。Oracle在数据库领域一直处
- 本文实例讲述了Python实现的求解最小公倍数算法。分享给大家供大家参考,具体如下:简单分析了一下,前面介绍的最大公约数的求解方法跟最小公倍
- 字符串函数查看字符的ascii码值ascii(str),str是空串时返回0select ascii('a');
- Vue加载流程1.初始化的第一阶段是Vue实例也就是vm对象创建前后:首先Vue进行生命周期,事件初始化发生在beforeCreate生命周
- 前言今天无意中发现在python中的一个多重赋值的小问题,自己一开始是比较简单化的理解了这个多重赋值操作的概念,所以导致在一道实现斐波那契数
- 在使用django-rest-framework开发项目的时候我们总是避免不了跨域的问题,因为现在大多数的项目都是前后端分离,前后端项目部署
- 单线程同步使用socket传输数据使用json序列化消息体struct将消息编码为二进制字节串,进行网络传输消息协议// 输入{  
- IF函数IF(expression ,expr_true, expr_false);MySQL的IF()函数,接受三个表达式,如果第一个表达
- 本文主要讲解如何使用python绘制三维的柱形图,如下图源代码如下:import numpy as npimport matplotlib.
- 加号+, 是字符串优先.并且从左向右计算. 就是运算前后两个值,只要有一个是字符串,就会将其中一个非字符串的试图转换成字符串.
- 下面给大家介绍python实现简易版的web服务器,具体内容详情大家通过本文学习吧!1、请自行了解HTTP协议https://www.jb5
- 本文实例为大家分享了python实现图片批量压缩程序的具体代码,供大家参考,具体内容如下说明运行环境:Win10 Pycharm
- 在基于 Git 的开发过程中,我们很容易遇到合并代码的情况,例如我们从 master 分支拉取了一个 feature 分支,当我们开发到一段
- LabelEncoder 和 OneHotEncoder 是什么- 在数据处理过程中,我们有时需要对不连续的数字或者文本进行数字化处理。-
- Python 内置的 zipfile 模块可以对文件(夹)进行ZIP格式的压缩和读取操作。要进行相关操作,首先需要实例化一个 ZipFile
- 一、概念它们都是Element的属性,表示元素的宽度:Element.clientWidth 内容+内边距-滚动条
- pandas中遍历dataframe的每一个元素假如有一个需求场景需要遍历一个csv或excel中的每一个元素,判断这个元素是否含有某个关键
- 一、前言昨夜刷b站的时候,看到了一条评论,形式如下图,于是心血来潮写了个python脚本,可以根据文字来生成这种由emoji拼接成的“文字”
- 本文实例为大家分享了js动态时间显示 的具体代码,供大家参考,具体内容如下<!doctype html><html>
- php会员登录模块是网站开发中很简单的一个模块,本实例主要给php初学者一个简单的参考,其中的逻辑还是要读者自己领会,多编多思考。login