当前位置: 首页 > news >正文

国外购买空间的网站有哪些seo课程

国外购买空间的网站有哪些,seo课程,德语网站制作,wordpress安装后要删除哪些文件夹读取合并单元格并保留合并信息 读取合并单元格并保留合并信息清除各单元格的空格和换行符,并去除列名中的空格和换行符 读取合并单元格并保留合并信息 当我们只是使用 pandas 的 read_excel 方法读取 Excel 文件时,我们可能会遇到一个很棘手的问题&…

读取合并单元格并保留合并信息

  • 读取合并单元格并保留合并信息
  • 清除各单元格的空格和换行符,并去除列名中的空格和换行符

读取合并单元格并保留合并信息

当我们只是使用 pandas 的 read_excel 方法读取 Excel 文件时,我们可能会遇到一个很棘手的问题:合并单元格的信息将会丢失,从而导致我们的数据出现重复或缺失的情况。

在本篇文章中将介绍使用 pandas 正确地读取包含合并单元格的 Excel 表格,支持 xlsx 和 xls。

import pandas as pd
from openpyxl import load_workbook
from xlrd import open_workbookdef read_xlsx(file, sheet_name=None, header=None):"""读取 xlsx 格式文件。"""excel = pd.ExcelFile(load_workbook(file), engine="openpyxl")sheet_name = sheet_name or excel.sheet_names[0]sheet = excel.book[sheet_name]df = excel.parse(sheet_name, header=header)for item in sheet.merged_cells:top_col, top_row, bottom_col, bottom_row = item.boundsbase_value = item.start_cell.value# 1-based index转为0-based indextop_row -= 1top_col -= 1# 由于前面的几行被设为了header,所以这里要对坐标进行调整if header is not None:top_row -= header + 1bottom_row -= header + 1df.iloc[top_row:bottom_row, top_col:bottom_col] = base_valuereturn dfdef read_xls(file, sheet_name=None, header=None):"""读取 xls 格式文件。"""excel = pd.ExcelFile(open_workbook(file, formatting_info=True), engine="xlrd")sheet_name = sheet_name or excel.sheet_names[0]sheet = excel.book[sheet_name]df = excel.parse(sheet_name, header=header)# 0-based indexfor top_row, bottom_row, top_col, bottom_col in sheet.merged_cells:base_value = sheet.cell_value(top_row, top_col)# 由于前面的几行被设为了header,所以这里要对坐标进行调整if header is not None:top_row -= header + 1bottom_row -= header + 1df.iloc[top_row:bottom_row, top_col:bottom_col] = base_valuereturn df

注:来源https://alanlee.fun/2023/04/27/pandas-read-excel-with-merged-cells/

清除各单元格的空格和换行符,并去除列名中的空格和换行符

在数据处理过程中,字符串中的多余空格和换行符常常会影响数据的整洁性以及后续分析。使用 .replace(‘\n’, ‘’).strip() 可以有效地去除换行符和前后空格,但这并不能解决中间空格的问题。为了解决这一问题,,通过使用字符串处理方法实现的 remove_spaces 函数能够高效地去除 Pandas DataFrame 中每个单元格及其列名的空格和换行符,同时也会移除字符串中的所有空格(包括字与字之间的空格)


def remove_spaces(df):"""去除 DataFrame 中各单元格的空格和换行符,并去除列名中的空格和换行符。"""# 处理列名df.columns = [col.replace('\n', '').strip() if isinstance(col, str) else col for col in df.columns]# 处理各单元格,去掉所有空格,包括中间的空格和换行符return df.apply(lambda col: col.map(lambda x: x.replace('\n', '').replace(' ', '') if isinstance(x, str) else x))
http://www.ritt.cn/news/2431.html

相关文章:

  • 深圳网站建设网页制作seo费用
  • 工具类网站怎么优化seo百度的广告推广需要多少费用
  • 郑州高端模板建站一个新产品策划方案
  • 做英文的小说网站有哪些武汉最新今天的消息
  • 想在自己的网站做支付天津网站排名提升
  • jsp做的求职招聘网站百度云嘉兴百度seo
  • 高唐做网站建设公司用asp做的网站
  • 青岛做网站皆赴青岛博采微信管理系统登录入口
  • 微信公众号微网站制作怎么制作一个简单的网页
  • 英文建站网站2345网址导航浏览器下载
  • 软件设计原则147seo工具
  • APP手机端电子商务网站建设百度百科官网首页
  • 建设网站需要懂什么淘宝关键词怎么选取
  • 做设计兼职的网站佛山seo技术
  • asp网站没有数据库关键词在线听
  • 磁力宅网站排名优化外包
  • dw软件怎么用安卓优化大师2023
  • 深圳做企业网站的公司seo优化教程自学网
  • 安阳网站建设哪家好最好用的搜索神器
  • 温州平台网站建设网络安全培训机构排名
  • 网上注册公司需要上传哪些资料南宁网站seo排名优化
  • wordpress开启https插件出错seo推广策略
  • 买了个服务器 怎么做网站常见的系统优化软件
  • 2核4g 1m做网站搜索引擎有哪些种类
  • 做国珍新时代 网站淘宝客推广一天80单
  • 深圳龙岗疫情最新消息多少例了深圳seo论坛
  • 国内的外贸b2c网站郑州seo代理公司
  • 网站频繁被攻击怎么办西安官网seo
  • H5酒店静态网站建设开题报告范文电脑优化大师官方免费下载
  • 百度做网站电话多少钱已备案域名购买平台