九色国产,午夜在线视频,新黄色网址,九九色综合,天天做夜夜做久久做狠狠,天天躁夜夜躁狠狠躁2021a,久久不卡一区二区三区

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
基于python的docx模塊處理word和WPS的docx格式文件方式

Python docx module for Word or WPS processing

本文是通過docx把word中的表格中的某些已填好的內(nèi)容提取出來,存入excel表格。

首先安裝docx的python模塊:

pip install python-docx

由于處理的為中文和符號(hào),改成utf-8編碼格式

1
2
3
4
5
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
from docx import Document
import pandas as pd
1
2
# 打開文件
doc = Document(ur'test_1.docx')

為了處理word中以對(duì)勾形式勾選的項(xiàng)目,采用下面 的方法

1、十字路口 √ 2、丁字路口 3、環(huán)形路口 4、人行立交

1
2
3
4
5
# 取出對(duì)號(hào)勾選的項(xiàng)目
print doc.tables[0].rows[3].cells[2].text
print doc.tables[0].rows[3].cells[2].text.split(u'√')[1].strip().split(' ')[0][2:]
'√' in doc.tables[0].rows[3].cells[2].text # 這個(gè)語句可以測(cè)試是否含有對(duì)勾,
# 有的話就取出對(duì)勾后面的item,否則直接返回填空的text

True

1
2
num_rows = len(doc.tables[0].rows)
print num_rows

xls = pd.read_csv(ur'output.csv')

1
2
print xls.columns[0]
diction = {}
1
2
3
4
5
6
7
# 找到每個(gè)excel文檔中需要被記錄的鍵值在docx文檔表格中的位置
for xlskey in xls.columns:
 for row_id in range(num_rows):
  row = doc.tables[0].rows[row_id]
  for cell_id in range(len(row.cells)):
   if row.cells[cell_id].text.strip() == xlskey.strip():
    diction[xlskey] = [row_id, cell_id]
1
2
3
# 查看一下獲得的鍵值位置
for key in list(diction.keys()):
 print key, diction[key]

樓層數(shù) [21, 1]

宗地形狀 [4, 1]

使用權(quán)取得時(shí)間 [14, 1]

采光通風(fēng)狀況 [19, 1]

已使用年限 [21, 4]

建筑朝向 [7, 1]

房屋結(jié)構(gòu) [17, 1]

交叉路口形式 [3, 1]

臨街狀況 [8, 1]

建筑容積率 [10, 5]

樓宇名稱 [15, 5]

質(zhì)量等級(jí) [18, 1]

周圍土地利用類型 [11, 1]

總建筑面積 [20, 1]

宗地位置 [0, 1]

所臨道路名稱 [2, 1]

裝修標(biāo)準(zhǔn) [16, 1]

那么我們認(rèn)為這些表頭鍵值對(duì)應(yīng)的填入數(shù)據(jù)就在他們的右邊,也就是下一個(gè)cell,因此我們只需要將row id不變,cell+1,就能取出填表內(nèi)容。

1
2
3
4
5
6
7
8
9
# 開始填表?。?!
for each_column in xls.columns:
 pos = diction[each_column]
 textion = doc.tables[0].rows[pos[0]].cells[pos[1] + 1].text
 if u'√' in textion:
  this_text = textion.strip(' ').split(u'√')[1].split()[0][2:]
 else:
  this_text = textion
 xls.loc[0, each_column] = this_text

xls


樓宇名稱宗地位置所臨道路名稱交叉路口形式宗地形狀建筑朝向臨街狀況周圍土地利用類型裝修標(biāo)準(zhǔn)房屋結(jié)構(gòu)質(zhì)量等級(jí)采光通風(fēng)狀況總建筑面積樓層數(shù)已使用年限建筑容積率使用權(quán)取得時(shí)間
0百興花園鄂州市鄂城區(qū)鳳凰路47-11號(hào)鳳凰路丁字路口多邊形離街商業(yè)用地豪華1、鋼 2、鋼、鋼混 3、鋼混 4、混合 5、磚木 6、其它完好122.7平方米813年

Succeed!!!

之后只需要用一個(gè)glob函數(shù)取出所有的文檔的path,然后依次執(zhí)行上面的命令,即可完成word表格到excel(實(shí)際上是csv形式)的自動(dòng)填表過程。

以上這篇基于python的docx模塊處理word和WPS的docx格式文件方式就是小編分享給大家的全部內(nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。

本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
Python自動(dòng)化辦公系列之Python操作Word
Python|讀取word文檔表格內(nèi)容
Python批量對(duì)word文檔進(jìn)行操作步驟
Python實(shí)現(xiàn)批量讀取word中表格信息的方法
生活中的python-利用python-docx自動(dòng)生成表格簡化工作流程
Python和Excel終于可以互通了,自動(dòng)化辦公實(shí)操寶典速來下載!
更多類似文章 >>
生活服務(wù)
熱點(diǎn)新聞
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服